| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202309*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Python強化學習-演算法.核心技術與行業應用 ISBN:9787111734895 出版社:機械工業 著編譯者:埃內斯.比爾金 叢書名:智能系統與技術叢書 頁數:348 所在地:中國大陸 *此為代購商品 書號:1580162 可大量預訂,請先連絡。 內容簡介 本書使用受現實世界商業和行業問題啟發的實際示例來講授強化學習技術的相關知識。 本書分為四部分:第一部分涵蓋強化學習的必要背景,包括定義、數學基礎和強化學習解決方案的概述;第二部分深入介紹最先進的強化學習演算法(規模化的深度Q-學習、基於策略的方法、基於模型的方法、多智能體強化學習等),包括每種演算法的優缺點;第三部分介紹強化學習中的高級技術,包括機器教學、泛化和域隨機化、元強化學習等主題,還涵蓋強化學習中有助於改進模型的各種高級主題;第四部分講解強化學習的各種應用,例如自主系統、供應鏈管理、營銷和金融、智慧城市與網路安全等,並討論強化學習領域的一些挑戰及未來方向。 學完本書,你將掌握如何訓練和部署自己的強化學習智能體來解決強化學習問題。作者簡介 埃內斯·比爾金(Enes Bilgin),微軟自主系統部門的高級人工智慧工程師和技術主管。他是一名機器學習與運籌學從業者和研究員,在使用Python、TensorFlow和Ray/RLlib為頂級科技公司構建生產系統和模型方面擁有豐富的經驗。他擁有波士頓大學系統工程碩士學位和博士學位,以及比爾肯特大學工業工程學士學位。他曾在亞馬遜擔任研究科學家,並在AMD擔任過運籌學研究科學家,還在得克薩斯大學奧斯汀分校的麥庫姆斯商學院和得克薩斯州立大學的英格拉姆工程學院擔任過兼職教師。目錄 譯者序前言 審校者簡介 第一部分 強化學習基礎 第1章 強化學習簡介 1 1 為什麼選擇強化學習 1 2 機器學習的三種範式 1 2 1 監督學習 1 2 2 無監督學習 1 2 3 強化學習 1 3 強化學習應用領域和成功案例 1 3 1 遊戲 1 3 2 機器人技術和自主系統 1 3 3 供應鏈 1 3 4 製造業 1 3 5 個性化和推薦系統 1 3 6 智慧城市 1 4 強化學習問題的元素 1 4 1 強化學習概念 1 4 2 將井字棋遊戲建模為強化學習問題 1 5 設置強化學習環境 1 5 1 硬體要求 1 5 2 操作系統 1 5 3 軟體工具箱 1 6 總結 1 7 參考文獻 第2章 多臂老虎機 2 1 探索–利用權衡 2 2 什麼是多臂老虎機問題 2 2 1 問題定義 2 2 2 一個簡單多臂老虎機問題的實驗 2 3 案例研究:在線廣告 2 4 A/B/n測試 2 4 1 符號 2 4 2 應用於在線廣告場景 2 4 3 A/B/n測試的優缺點 2 5 ε-貪心策略行動 2 5 1 應用於在線廣告場景 2 5 2 ε-貪心策略行動的優缺點 2 6 使用置信上界進行行動選擇 2 6 1 應用於在線廣告場景 2 6 2 使用置信上界的優缺點 2 7 湯普森(后)採樣 2 7 1 應用於在線廣告場景 2 7 2 湯普森採樣的優缺點 2 8 總結 2 9 參考文獻 第3章 上下文多臂老虎機 第4章 馬爾可夫決策過程的制定 第5章 求解強化學習問題 第二部分 深度強化學習 第6章 規模化的深度Q-學習 第7章 基於策略的方法 第8章 基於模型的方法 第9章 多智能體強化學習 第三部分 強化學習中的高級主題 第10章 機器教學 第11章 泛化和域隨機化 第12章 元強化學習 第13章 其他高級主題 第四部分 強化學習的應用 第14章 自主系統 第15章 供應鏈管理 第16章 營銷、個性化和金融 第17章 智慧城市與網路安全 第18章 強化學習領域的挑戰和未來方向 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |