*數量非實際在台庫存 *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為實際資訊。 印行年月:202312*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:TensorFlow2強化學習手冊 ISBN:9787302643388 出版社:清華大學 著編譯者:(美)普拉文.帕拉尼薩米 頁數:331 所在地:中國大陸 *此為代購商品 書號:1603614 可大量預訂,請先連絡。 內容簡介 深度強化學習能夠構建智能體、產品和服務,超越計算機視覺或感知執行動作。TensorFlow 2 x是最流行的深度學習框架的最新主要版本,用於開發和訓練深度神經網路。 本書介紹了深度強化學習的基本原理和TensorFlow的最新版本,同時也介紹了OpenAl Gym、基於模型和無模型的強化學習,並學習如何開發基本智能體。同時給出了高級深度強化學習演算法(Actor-Critic、深度確定性策略梯度、深度Q網路、近端策略優化和深度遞歸Q網路等)的實現。作者簡介 王璽鈞,中山大學電子與信息工程學院副教授。主要研究方向包括智能物聯網、無人機通信和群智學習,發表論文90餘篇,參撰著作1部,獲授權發明專利40餘項。目錄 第1章 使用TensorFlow 2 x開發深度強化學習的基本模塊1 1 技術要求 1 2 構建訓練強化學習智能體的環境和獎勵機制 1 2 1 前期準備 1 2 2 實現步驟 1 2 3 工作原理 1 3 針對離散動作空間和離散決策問題實現基於神經網路的強化學習策略 1 3 1 前期準備 1 3 2 實現步驟 1 3 3 工作原理 1 4 針對連續動作空間和連續控制問題實現基於神經網路的強化學習策略 1 4 1 前期準備 1 4 2 實現步驟 1 4 3 工作原理 1 5 將OpenAI Gym作為強化學習的訓練環境 1 5 1 前期準備 1 5 2 實現步驟 1 5 3 工作原理 1 6 構建神經網路智能體 1 6 1 前期準備 1 6 2 實現步驟 1 6 3 工作原理 1 7 構建神經網路進化智能體 1 7 1 前期準備 1 7 2 實現步驟 1 7 3 工作原理 1 8 參考資料 第2章 基於價值、策略和行動者-評論家的深度強化學習演算法實現 2 1 技術要求 2 2 構建用於訓練強化學習智能體的隨機環境 2 2 1 前期準備 2 2 2 實現步驟 2 2 3 工作原理 2 3 構建基於價值的強化學習智能體演算法 2 3 1 前期準備 2 3 2 實現步驟 2 3 3 工作原理 2 4 實現時序差分學習 2 4 1 前期準備 2 4 2 實現步驟 2 4 3 工作原理 2 5 構建強化學習中的蒙特卡洛預測和控制演算法 2 5 1 前期準備 2 5 2 實現步驟 2 5 3 工作原理 2 6 實現SARSA演算法和對應的強化學習智能體 2 6 1 前期準備 2 6 2 實現步驟 2 6 3 工作原理 2 7 構建基於Q學習的智能體 2 7 1 前期準備 2 7 2 實現步驟 2 7 3 工作原理 2 8 實現策略梯度 2 8 1 前期準備 2 8 2 實現步驟 2 8 3 工作原理 2 9 實現行動者-評論家演算法 2 9 1 前期準備 2 9 2 實現步驟 2 9 3 工作原理 第3章 高級強化學習演算法的實現 第4章 現實世界中的強化學習——構建加密貨幣交易智能體 第5章 現實世界中的強化學習——建立股票/股份交易智能體 第6章 現實世界中的強化學習——構建智能體來完成您的待辦事項 第7章 在雲端部署深度強化學習智能體 第8章 使用分散式訓練加速深度強化學習智能體開發 第9章 深度強化學習智能體的多平台部署 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |