基於Python的強化學習 (美)安德里亞.隆薩著劉繼紅王瑞文譯 9787519870379 【台灣高等教育出版社】

Name: 基於Python的強化學習 (美)安德里亞.隆薩著 劉繼紅 王瑞文譯 9787519870379 【台灣高等教育出版社】
Brand: abooksthep
SKU: 9787519870379
Price: 560.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：中國電力

NT$560

商品編號: 9787519870379

供貨狀況: 尚有庫存

加入最愛

商品介紹

*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202301*若逾兩年請先於客服中心或Line洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：基於Python的強化學習
ISBN：9787519870379
出版社：中國電力
著編譯者：(美)安德里亞.隆薩著劉繼紅王瑞文譯
頁數：265頁
所在地：中國大陸 *此為代購商品
書號：1519976
可大量預訂，請先連絡。

內容簡介

本書首先介紹在強化學習環境中工作所需的工具、庫和設置，涵蓋了強化學習的構成模塊，深入探討基於值的方法，如Q-learning和SARSA演算法的應用。讀者將學習如何結合使用Q-learning和神經網絡來解決複雜問題。此外，在學習DDPG和TD3確定性演算法之前，讀者將學習策略梯度方法，如TRPO和PPO，以提高性能和穩定性。本書還介紹模仿學習的原理，以及Dagger如何教智能體飛行。讀者將探索進化策略和黑盒優化技術。最後，讀者將掌握探索方法，如UCB和UCB1，並開發一個名為ESBAS的元演算法。如果你是人工智能研究者、深度學慣用戶，或者希望從頭開始學習強化學習的人，那麼這本書就很適合你。如果你想了解該領域的進展，也會發現這本書很有幫助。當然，Python的基礎知識是必需的。

作者簡介

安德里亞·隆薩是一名深度學習工程師，對人工智能懷有極大的熱情，渴望創造出具有智能行為的機器。他通過理論性的和工業應用性的機器學習項目獲得了強化學習、自然語言處理和計算機視覺方面的專業知識。他還參加過幾次Kaggle比賽，並取得了很好的成績。他總是在尋找引人入勝的挑戰，並喜歡證明自己。

前言
第一部分演算法與環境
第l章強化學習概貌
1 1 強化學習導論
1 1 1 比較強化學習和監督學習
1 1 2 強化學習的歷史
1 1 3 深度強化學習
1 2 強化學習的要素
1 2 1 策略
1 2 2 值函數
1 2 3 回報(獎勵)
1 2 4 模型
1 3 強化學習的應用
1 3 1 遊戲
1 3 3 機器學習
1 3 4 經濟學與金融
1 3 5 醫療健康
1 3 6 智能交通系統
1 3 7 能源優化與智能電網
1 4 本章小結
1 5 思考題
1 6 延伸閱讀
第2章強化學習過程與OpenAI Gym
2 1 環境設置
2 1 1 安裝OpenAI Gym
2 1 2 安裝Roboschool
2 2 OpenAI Gym和強化學習過程
2 2 1 開發強化學習過程
2 2 2 了解空間概念
2 3 利用TesorFlow開發強化學習模型
2 3 1 張量
2 3 2 創建計算圖
2 3 3 線性回歸示例
2 4 TensorBoard介紹
2 5 強化學習環境
2 5 1 為什麼需要不同的環境
2 5 2 開源環境
2 6 本章小結
2 7 思考題
2 8 延伸閱讀
第3章基於動態規劃的問題求解
3 1 馬爾可夫決策過程
3 1 1 策略
3 1 2 回報
3 1 3 值函數
3 1 4 貝爾曼方程
3 2 強化學習演算法的類別
3 2 1 無模型演算法
3 2 2 基於模型的強化學習
3 2 3 演算法多樣性
3 3 動態規劃
3 3 1 策略評價與策略改進
3 3 2 策略迭代
3 3 3 值迭代
3 4 本章小結
3 5 思考題
3 6 延伸閱讀

第二部分無模型強化學習演算法
第三部分超越無模型演算法
附錄思考題參考答案

詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於客服中心或Line或本社留言板留言，我們即儘速上架。

規格說明

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

基於Python的強化學習 (美)安德里亞.隆薩著 劉繼紅 王瑞文譯 9787519870379 【台灣高等教育出版社】

商品介紹

規格說明

運送方式

相關商品

基於Python的強化學習 (美)安德里亞.隆薩著劉繼紅王瑞文譯 9787519870379 【台灣高等教育出版社】