內容簡介
多智能體強化學習(Multi-Agent Reinforcement Learning,MARL)是機器學習中的一個領域,研究多個智能體如何在共享環境中學習最優的交互方式。這一領域在現代生活中有著廣泛的應用,包括自動駕駛、多機器人工廠、自動化交易和能源網絡管理等。 本書是一部系統闡述多智能體強化學習理論與技術的權威著作,清晰而嚴謹地介紹了MARL的模型、解決方案概念、算法思想、技術挑戰以及現代方法。書中首先介紹了該領域的基礎知識,包括強化學習理論和算法的基礎、互動式博弈模型、博弈中的不同解決方案概念以及支撐MARL研究的算法思想。隨後,書中詳細介紹了利用深度學習技術的現代MARL算法,涵蓋集中訓練與分散執行、價值分解、參數共享和自博弈等思想。本書還附帶了一個用Python編寫的MARL代碼庫,其中包括自包含且易於閱讀的MARL算法實現。 本書技術內容以易於理解的語言解釋,並通過大量示例進行說明,既為初學者闡明了MARL的概念,也為專業的讀者提供了高層次的見解。作者簡介
斯特凡諾·V 阿爾布萊希特(Stefano V Albrecht) 愛丁堡大學信息學院人工智能專業副教授,並擔任該校自主智能體研究組負責人,同時是英國皇家工程院工業研究員、阿蘭·圖靈研究所多智能體系統研究團隊領軍學者。他的研究聚焦自主智能體、多智能體系統、強化學習和博弈論領域,核心方向是不確定情況下的序貫決策。目錄
譯者序