多智能體強化學習-基礎與現代方法 9787111776871 斯特凡諾.V.阿爾布萊希特 菲利波斯.克里 斯蒂安諾斯 盧

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$693
商品編號: 9787111776871
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202504*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:多智能體強化學習-基礎與現代方法
ISBN:9787111776871
出版社:機械工業
著編譯者:斯特凡諾.V.阿爾布萊希特 菲利波斯.克里 斯蒂安諾斯 盧卡
頁數:241
所在地:中國大陸 *此為代購商品
書號:1732118
可大量預訂,請先連絡。

【台灣高等教育出版社簡體書】 多智能體強化學習-基礎與現代方法 787111776871 斯特凡諾.V.阿爾布萊希特 菲利波斯.克里 斯蒂安諾斯 盧卡

內容簡介

多智能體強化學習(Multi-Agent Reinforcement Learning,MARL)是機器學習中的一個領域,研究多個智能體如何在共享環境中學習最優的交互方式。這一領域在現代生活中有著廣泛的應用,包括自動駕駛、多機器人工廠、自動化交易和能源網絡管理等。 本書是一部系統闡述多智能體強化學習理論與技術的權威著作,清晰而嚴謹地介紹了MARL的模型、解決方案概念、算法思想、技術挑戰以及現代方法。書中首先介紹了該領域的基礎知識,包括強化學習理論和算法的基礎、互動式博弈模型、博弈中的不同解決方案概念以及支撐MARL研究的算法思想。隨後,書中詳細介紹了利用深度學習技術的現代MARL算法,涵蓋集中訓練與分散執行、價值分解、參數共享和自博弈等思想。本書還附帶了一個用Python編寫的MARL代碼庫,其中包括自包含且易於閱讀的MARL算法實現。 本書技術內容以易於理解的語言解釋,並通過大量示例進行說明,既為初學者闡明了MARL的概念,也為專業的讀者提供了高層次的見解。

作者簡介

斯特凡諾·V 阿爾布萊希特(Stefano V Albrecht) 愛丁堡大學信息學院人工智能專業副教授,並擔任該校自主智能體研究組負責人,同時是英國皇家工程院工業研究員、阿蘭·圖靈研究所多智能體系統研究團隊領軍學者。他的研究聚焦自主智能體、多智能體系統、強化學習和博弈論領域,核心方向是不確定情況下的序貫決策。

目錄

譯者序
前言
符號總覽
第1章 引言
1 1 多智能體系統
1 2 多智能體強化學習
1 3 應用示例
1 3 1 多機器人倉庫管理
1 3 2 棋盤遊戲和電子遊戲中的競爭性對戰
1 3 3 自動駕駛
1 3 4 電子市場中的自動化交易
1 4 多智能體強化學習的挑戰
1 5 多智能體強化學習的議題
1 6 本書內容和結構
第一部分 多智能體強化學習的基礎
第2章 強化學習
2 1 一般定義
2 2 馬爾可夫決策過程
2 3 期望折扣回報和最優策略
2 4 價值函數與貝爾曼方程
2 5 動態規劃
2 6 時序差分學習
2 7 學習曲線評估
2 8 R(s,a,s')和R(s,a)的等價性
2 9 總結
第3章 博弈:多智能體交互模型
3 1 標準式博弈
3 2 重複標準式博弈
3 3 隨機博弈
3 4 部分可觀測隨機博弈
3 5 建模通信
3 6 博弈中的知識假設
3 7 詞典:強化學習與博弈論
3 8 總結
第4章 博弈的解概念
4 1 聯合策略與期望回報
4 2 最佳響應
4 3 極小極大算法
4 4 納什均衡
4 5 ε-納什均衡
4 6 (粗)相關均衡
4 7 均衡解的概念局限性
4 8 帕雷托最優
4 9 社會福利和公平

第二部分 多智能體深度強化學習:算法與實踐
多智能體強化學習研究綜述
參考文獻
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理