智能決策-方法與技術孫怡峰王玉賓 9787030770479 【台灣高等教育出版社】

Name: 智能決策-方法與技術 孫怡峰 王玉賓 9787030770479 【台灣高等教育出版社】
Brand: abooksthep
Price: 763.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：科學

NT$763

商品編號:

供貨狀況: 尚有庫存

加入最愛

商品介紹

*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202408*若逾兩年請先於私訊洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：智能決策-方法與技術
ISBN：9787030770479
出版社：科學
著編譯者：孫怡峰王玉賓
頁數：257
所在地：中國大陸 *此為代購商品
書號：1680318
可大量預訂，請先連絡。

內容簡介

智能決策是邁向通用人工智慧的必經之路。2016年，圍棋智能體AlphaGo戰勝韓國棋手李世石，智能決策引起人們的廣泛關注；2022年底，ChatGPT火爆全球，凸顯出大模型的價值。可以預見，神經網路大模型將進一步推動智能決策在自主學習和應用範圍上的突破。本書圍繞智能決策領域涉及的基本方法與技術展開介紹，主要內容包括：智能決策與智能體的基本概念，智能體所處環境的分類與建模，確定環境下智能體的搜索推理決策方法，不確定環境下決策策略強化學習方法、博弈學習方法，複雜策略的深層神經網路建模與應用，以及網格世界遊戲、「雅達利」遊戲、圍棋對弈、「星際爭霸」即時戰略對抗遊戲、陸戰對抗等實例下智能體的決策策略生成技術和部分Python代碼實現。本書既適合人工智慧、系統模擬、作戰實驗、元宇宙等相關領域的科技人員閱讀，也適合高等院校計算機、自動化等專業的高年級本科生和研究生學習。

前言
第1章智能決策概述
1 1 智能決策的內涵
1 1 1 基本概念
1 1 2 兩個關鍵問題
1 1 3 虛擬環境
1 2 當前成果與技術流派
1 2 1 當前成果
1 2 2 三大流派
1 3 未來應用與發展方向
1 3 1 為複雜體系提供輔助決策
1 3 2 為無人系統提升自主能力
第2章基本理論與模型
2 1 決策的基本理論
2 1 1 人類決策的一般過程
2 1 2 決策的認知心理學描述
2 2 智能體模型理論
2 2 1 智能體的基本概念
2 2 2 與一般決策的不同
2 3 知識與環境描述
2 3 1 知識表示
2 3 2 環境描述方法
2 3 3 環境與智能體分類
第3章確定環境下的搜索推理決策方法
3 1 智能體的描述與分析
3 1 1 智能體的決策問題
3 1 2 問題的形式化
3 1 3 問題蘊含的知識
3 2 搜索推理決策方法
3 2 1 智能體的決策
3 2 2 搜索演算法基礎
3 2 3 無信息搜索策略
3 2 4 啟髮式搜索策略
3 3 自動規劃與知識描述
3 3 1 集合論描述
3 3 2 經典規劃描述
3 3 3 時態規劃模型
第4章不確定環境下的決策策略生成方法
4 1 不確定環境下的基本決策方法
4 1 1 隨機不確定環境下的最大期望效用決策
4 1 2 博弈不確定環境下的純策略決策
4 1 3 博弈不確定環境下的混合策略決策
4 2 決策策略的強化學習演算法
4 2 1 強化學習的基本概念
4 2 2 有模型的強化學習
4 2 3 無模型的強化學習
第5章神經網路與決策策略建模
5 1 神經網路的基本概念
5 1 1 神經網路的定義
5 1 2 神經元模型
5 2 全連接反向傳播與監督學習
5 2 1 反向傳播演算法
5 2 2 前饋多層神經網路
5 2 3 監督學習下的損失函數
5 2 4 參數初始化與參數更新方法
5 3 卷積神經網路及其反向傳播
5 3 1 卷積神經網路結構
5 3 2 卷積神經網路中的反向傳播
5 4 神經網路在決策策略建模中的應用
5 4 1 擬合狀態價值函數與直接生成動作
5 4 2 策略網路的訓練
5 4 3 Actor-Critic方法
第6章簡單遊戲中的智能決策技術
6 1 OpenAI Gym與虛擬環境
6 2 表格Q學習與網格世界遊戲決策
6 2 1 遊戲環境與Q學習實現
6 2 2 湖面溜冰遊戲決策
6 3 DQN與打磚塊遊戲決策
6 3 1 打磚塊遊戲環境
6 3 2 DQN演算法過程
6 3 3 DQN核心代碼
6 3 4 打磚塊遊戲智能體的實現
第7章完全信息下的棋類智能決策技術
7 1 AlphaZero演算法原理
7 1 1 基本思路
7 1 2 蒙特卡羅樹搜索基礎
7 1 3 自我博弈與神經網路設計
7 2 棋盤遊戲環境實現
7 2 1 N子棋走子
7 2 2 棋盤環境
7 3 AlphaZero演算法實現
7 3 1 自我博弈實現
7 3 2 蒙特卡羅樹搜索
7 3 3 策略價值網路
7 3 4 訓練與決策
第8章不完全信息下的對抗策略的博弈學習
8 1 博弈學習演算法
8 1 1 博弈學習的基本概念
8 1 2 博弈及其策略的形式化描述
8 1 3 博弈學習動力學及學習演算法
8 2 「星際爭霸」遊戲對抗問題分析
8 2 1 「星際爭霸」遊戲環境
8 2 2 決策問題分析
8 3 AlphaStar中的決策神經網路和博弈學習技術
8 3 1 動作體系與狀態觀測量
8 3 2 神經網路結構概況與監督學習
8 3 3 神經網路強化學習的基本方法
8 3 4 加權虛擬自我博弈與聯盟學習
第9章戰術級陸戰對抗策略的智能生成
9 1 陸戰人機對抗環境
9 1 1 陸戰對抗場景
9 1 2 廟算平台的環境介面
9 2 智能體的基本框架
9 2 1 智能體對棋子的控制
9 2 2 高層動作的實施邏輯
9 3 基於先驗收益的目標點位選擇的初始策略
9 3 1 目標點位選擇問題分析
9 3 2 博弈模型構建
9 3 3 收益值計算與混合策略求解
9 4 目標點位選擇策略的博弈學習
9 4 1 博弈學習架構設計
9 4 2 神經網路結構設計
9 4 3 神經網路參數博弈學習
參考文獻
附錄A 神經網路的使用
A 1 PyTorch框架下神經網路的使用
A 2 TensorFlow Keras框架下神經網路的使用
附錄B 廟算平台介面
B 1 態勢介面
B 2 機動動作介面
詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於PChome商店街私訊告知ISBN或書號，我們即儘速上架。