內容簡介
本書首先介紹在強化學習環境中工作所需的工具、庫和設置,涵蓋了強化學習的構成模塊,深入探討基於值的方法,如Q-learning和SARSA演算法的應用。讀者將學習如何結合使用Q-learning和神經網絡來解決複雜問題。此外,在學習DDPG和TD3確定性演算法之前,讀者將學習策略梯度方法,如TRPO和PPO,以提高性能和穩定性。本書還介紹模仿學習的原理,以及Dagger如何教智能體飛行。讀者將探索進化策略和黑盒優化技術。最後,讀者將掌握探索方法,如UCB和UCB1,並開發一個名為ESBAS的元演算法。 如果你是人工智能研究者、深度學慣用戶,或者希望從頭開始學習強化學習的人,那麼這本書就很適合你。如果你想了解該領域的進展,也會發現這本書很有幫助。當然,Python的基礎知識是必需的。作者簡介
安德里亞·隆薩是一名深度學習工程師,對人工智能懷有極大的熱情,渴望創造出具有智能行為的機器。他通過理論性的和工業應用性的機器學習項目獲得了強化學習、自然語言處理和計算機視覺方面的專業知識。他還參加過幾次Kaggle比賽,並取得了很好的成績。他總是在尋找引人入勝的挑戰,並喜歡證明自己。目錄
前言