深度強化學習算法及其在智能決策中的應用研究馬聰孫若斌 9787513677738 【台灣高等教育出版社】

Name: 深度強化學習算法及其在智能決策中的應用研究 馬聰 孫若斌 9787513677738 【台灣高等教育出版社】
Brand: abooksthep
SKU: 9787513677738
Price: 496.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：中國經濟

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

NT$496

商品編號: 9787513677738

供貨狀況: 尚有庫存

加入最愛

商品介紹

*書籍均為代購，我們向大陸付款發訂後即無法取消，為避免造成不必要的損失，
下訂前請慎重考慮！下訂前請慎重考慮！謝謝。
*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202405*若逾兩年請先於客服中心或Line洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：深度強化學習算法及其在智能決策中的應用研究
ISBN：9787513677738
出版社：中國經濟
著編譯者：馬聰孫若斌
頁數：179
所在地：中國大陸 *此為代購商品
書號：1733602
可大量預訂，請先連絡。

內容簡介

隨著人工智能時代的到來，特別是AlphaGo、ChatGPT等突破性技術的問世，深度強化學習算法已展現出其獨特的優勢，並在處理複雜決策問題方面發揮出巨大潛力。深度強化學習算法將深度學習的感知能力與強化學習的決策能力相結合，實現了端到端的學習，是一種更加接近於人類思維方式的人工智能算法。然而，目前對深度強化學習算法的研究仍處於初步發展階段，面臨諸多挑戰，包括樣本利用效率低、「探索和利用」難以平衡及獎勵函數設計困難等問題。本書系統闡述了深度強化學習算法的理論和原理，針對其在量化金融、工業運維等應用領域所面臨的研究難點，展開相關研究，並創新性地提出相應的改進算法，以推動深度強化學習算法在智能決策領域的進一步發展。

作者簡介

馬聰，女，1994年生，西安交通大學統計學博士，西北大學經濟管理學院講師。任中國運籌學會會員、陝西省證券研究會會員。主要從事機器學習算法、量化金融、經濟金融大數據等方面的研究。目前在國內外學術期刊發表論文10餘篇，主持國家自然科學基金項目、教育部人文社科項目等4項，參与多項國家級項目。

1 緒論
1 1 研究背景與研究意義
1 2 國內外研究現狀綜述
1 3 研究內容及創新
1 4 本書的組織結構
2 深度強化學習算法概述
2 1 強化學習算法的原理
2 2 最優價值算法
2 3 基於策略梯度的算法
2 4 小結
3 基於信息瓶頸理解正則化算法的工作原理
3 1 引言
3 2 相關工作
3 3 正則項的工作原理
3 4 實驗
3 5 小結
4 多模塊并行的單資產交易深度強化學習算法
4 1 引言
4 2 用於單資產交易的PMMRL算法
4 3 實驗
4 4 小結
5 趨勢一致的多智能體投資組合強化學習算法
5 1 引言
5 2 用於投資組合管理的深度強化學習算法
5 3 趨勢一致正則項
5 4 實驗
5 5 風險管理
5 6 小結
6 針對複雜多步驟任務的多環境并行的深度強化學習算法
6 1 引言
6 2 多環境并行的獎勵塑形算法
6 3 數值實驗
6 4 小結
7 深度強化學習在工業智能運維中的應用
7 1 引言
7 2 深度強化學習在智能運維中的優勢
7 3 強化學習算法在各工業領域中的應用
7 4 小結
8 總結與展望
8 1 總結
8 2 展望
參考文獻
與本書相關的研究成果
附錄 A 技術指標
附錄 B 評價指標
索引
後記
詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於客服中心或Line或本社留言板留言，我們即儘速上架。

規格說明

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

深度強化學習算法及其在智能決策中的應用研究 馬聰 孫若斌 9787513677738 【台灣高等教育出版社】

商品介紹

規格說明

運送方式

相關商品

深度強化學習算法及其在智能決策中的應用研究馬聰孫若斌 9787513677738 【台灣高等教育出版社】