基於Python的強化學習 (美)安德里亞.隆薩著 劉繼紅 王瑞文譯 9787519870379 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:中國電力
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$560
商品編號: 9787519870379
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202301*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:基於Python的強化學習
ISBN:9787519870379
出版社:中國電力
著編譯者:(美)安德里亞.隆薩著 劉繼紅 王瑞文譯
頁數:265頁
所在地:中國大陸 *此為代購商品
書號:1519976
可大量預訂,請先連絡。

內容簡介

本書首先介紹在強化學習環境中工作所需的工具、庫和設置,涵蓋了強化學習的構成模塊,深入探討基於值的方法,如Q-learning和SARSA演算法的應用。讀者將學習如何結合使用Q-learning和神經網絡來解決複雜問題。此外,在學習DDPG和TD3確定性演算法之前,讀者將學習策略梯度方法,如TRPO和PPO,以提高性能和穩定性。本書還介紹模仿學習的原理,以及Dagger如何教智能體飛行。讀者將探索進化策略和黑盒優化技術。最後,讀者將掌握探索方法,如UCB和UCB1,並開發一個名為ESBAS的元演算法。 如果你是人工智能研究者、深度學慣用戶,或者希望從頭開始學習強化學習的人,那麼這本書就很適合你。如果你想了解該領域的進展,也會發現這本書很有幫助。當然,Python的基礎知識是必需的。

作者簡介

安德里亞·隆薩是一名深度學習工程師,對人工智能懷有極大的熱情,渴望創造出具有智能行為的機器。他通過理論性的和工業應用性的機器學習項目獲得了強化學習、自然語言處理和計算機視覺方面的專業知識。他還參加過幾次Kaggle比賽,並取得了很好的成績。他總是在尋找引人入勝的挑戰,並喜歡證明自己。

目錄

前言
第一部分 演算法與環境
第l章 強化學習概貌
1 1 強化學習導論
1 1 1 比較強化學習和監督學習
1 1 2 強化學習的歷史
1 1 3 深度強化學習
1 2 強化學習的要素
1 2 1 策略
1 2 2 值函數
1 2 3 回報(獎勵)
1 2 4 模型
1 3 強化學習的應用
1 3 1 遊戲
1 3 3 機器學習
1 3 4 經濟學與金融
1 3 5 醫療健康
1 3 6 智能交通系統
1 3 7 能源優化與智能電網
1 4 本章小結
1 5 思考題
1 6 延伸閱讀
第2章 強化學習過程與OpenAI Gym
2 1 環境設置
2 1 1 安裝OpenAI Gym
2 1 2 安裝Roboschool
2 2 OpenAI Gym和強化學習過程
2 2 1 開發強化學習過程
2 2 2 了解空間概念
2 3 利用TesorFlow開發強化學習模型
2 3 1 張量
2 3 2 創建計算圖
2 3 3 線性回歸示例
2 4 TensorBoard介紹
2 5 強化學習環境
2 5 1 為什麼需要不同的環境
2 5 2 開源環境
2 6 本章小結
2 7 思考題
2 8 延伸閱讀
第3章 基於動態規劃的問題求解
3 1 馬爾可夫決策過程
3 1 1 策略
3 1 2 回報
3 1 3 值函數
3 1 4 貝爾曼方程
3 2 強化學習演算法的類別
3 2 1 無模型演算法
3 2 2 基於模型的強化學習
3 2 3 演算法多樣性
3 3 動態規劃
3 3 1 策略評價與策略改進
3 3 2 策略迭代
3 3 3 值迭代
3 4 本章小結
3 5 思考題
3 6 延伸閱讀

第二部分 無模型強化學習演算法
第三部分 超越無模型演算法
附錄 思考題參考答案

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理