內容簡介
本書循序漸進地講解了使用Python語言實現強化學習的核心算法開發的知識,內容涵蓋了數據處理、算法、大模型等知識,並通過具體實例的實現過程演練了各個知識點的使用方法和使用流程。《強化學習基礎、原理與應用》共分為17章,主要內容包括強化學習基礎、馬爾可夫決策過程、蒙特卡洛方法、Q-learning與貝爾曼方程、時序差分學習和SARSA算法、DQN算法、DDQN算法、競爭DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、連續動作空間的強化學習、值分散式算法、基於模型的強化學習、多智能體強化學習實戰:Predator-Prey遊戲及自動駕駛系統。本書內容簡潔而不失技術深度,以極簡的文字介紹了複雜的案例,易於閱讀和理解。 本書適用於已經了解Python語言基礎語法的讀者,想進一步學習強化學習、機器學習、深度學習及相關技術的讀者,還可作為大專院校相關專業的師生用書和培訓機構的教材使用。目錄
第1章 強化學習基礎