智能控制與強化學習先進值迭代評判設計王鼎趙明明哈明鳴任進 9787115633958 【台灣高等教育出版社】

Name: 智能控制與強化學習先進值迭代評判設計 王鼎 趙明明 哈明鳴 任進 9787115633958 【台灣高等教育出版社】
Brand: abooksthep
Price: 889.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：人民郵電

NT$889

商品編號:

供貨狀況: 尚有庫存

加入最愛

商品介紹

*數量非實際在台庫存
*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為實際資訊。
印行年月：202403*若逾兩年請先於私訊洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：智能控制與強化學習先進值迭代評判設計
ISBN：9787115633958
出版社：人民郵電
著編譯者：王鼎趙明明哈明鳴任進
頁數：236
所在地：中國大陸 *此為代購商品
書號：1623874
可大量預訂，請先連絡。

內容簡介

在人工智慧技術的大力驅動下，智能控制與強化學習發展迅猛，先進自動化設計與控制日新月異。本書針對複雜離散時間系統的優化調節、最優跟蹤、零和博弈等問題，以實現穩定學習、演化學習和快速學習為目標，建立一套先進的值迭代評判學習控制理論與設計方法。首先，對先進值迭代框架下迭代策略的穩定性進行全面深入的分析，建立一系列適用於不同場景的穩定性判據，從理論層面揭示值迭代演算法能夠實現離線最優控制和在線演化控制。其次，基於迭代歷史信息，提出一種新穎的收斂速度可調節的值迭代演算法，有助於加快學習速度、減少計算代價，更高效地獲得非線性系統的最優控制律。結合人工智慧技術，對無模型值迭代評判學習控制的發展前景也進行了討論。本書內容豐富、結構清晰、由淺入深、分析透徹，既可作為智能控制、強化學習、優化控制、計算智能、自適應與學習系統等領域研究人員和學生的參考書，又可供相關領域的技術人員使用。

第1章智能評判控制的先進值迭代方法概述
1 1 引言
1 2 面向最優調節的值迭代演算法
1 2 1 離散時間HJB方程
1 2 2 傳統值迭代演算法
1 2 3 廣義值迭代演算法
1 2 4 集成值迭代演算法
1 2 5 演化值迭代演算法
1 2 6 可調節值迭代演算法
1 3 面向最優跟蹤的值迭代演算法
1 3 1 求解穩態控制的值迭代跟蹤演算法
1 3 2 無穩態控制的值迭代跟蹤演算法
1 4 面向零和博弈的值迭代演算法
1 4 1 離散時間HJI方程
1 4 2 零和博弈最優調節問題
1 4 3 零和博弈最優跟蹤問題
1 5 小結
參考文獻
第2章基於折扣廣義值迭代的線性最優調節與穩定性分析
2 1 引言
2 2 問題描述
2 3 線性系統的折扣廣義值迭代演算法
2 3 1 折扣廣義值迭代演算法推導
2 3 2 性能分析
2 4 模擬實驗
2 5 小結
參考文獻
第3章基於折扣廣義值迭代的非線性最優控制與穩定性分析
3 1 引言
3 2 問題描述
3 3 非線性系統的折扣廣義值迭代演算法
3 3 1 折扣廣義值迭代演算法推導
3 3 2 性能分析
3 4 模擬實驗
3 5 小結
參考文獻
第4章基於折扣廣義值迭代的非線性智能最優跟蹤
4 1 引言
4 2 問題描述
4 3 面向智能最優跟蹤的廣義值迭代
4 3 1 面向最優跟蹤的折扣廣義值迭代演算法推導
4 3 2 面向最優跟蹤的折扣廣義值迭代演算法性質
4 4 基於神經網路的演算法實現
4 5 模擬實驗
4 6 小結
參考文獻
第5章基於廣義值迭代的新型事件觸發最優跟蹤控制
5 1 引言
5 2 問題描述
5 3 基於事件的近似最優跟蹤控制設計
5 3 1 廣義值迭代演算法推導
5 3 2 事件觸發最優控制設計
5 4 基於神經網路的演算法實現
5 4 1 模型網路
5 4 2 評判網路
5 4 3 執行網路
5 5 模擬實驗
5 6 小結
參考文獻
第6章具有先進評判學習結構的廣義值迭代軌跡跟蹤
6 1 引言
6 2 問題描述
6 2 1 傳統代價函數的局限性
6 2 2 基於新型代價函數的最優跟蹤控制
6 3 基於新型代價函數的廣義值迭代演算法
6 3 1 具有新型代價函數的廣義值迭代演算法推導
6 3 2 具有新型代價函數的廣義值迭代演算法性質
6 4 具有新型代價函數的迭代二次啟髮式規劃演算法
6 4 1 迭代二次啟髮式規劃演算法推導
6 4 2 未知系統動態辨識
6 4 3 單一神經網路演算法實現
6 5 模擬實驗
6 6 小結
參考文獻
第7章融合集成與演化值迭代的非線性零和博弈設計
7 1 引言
7 2 問題描述
7 3 面向零和博弈的廣義值迭代演算法
7 3 1 非線性零和博棄的廣義值迭代演算法推導
7 3 2 線性零和博棄的廣義值迭代演算法推導
7 3 3 面向零和博弈的廣義值迭代演算法特性
7 4 零和博弈問題的演化值迭代控制設計
7 5 模擬實驗
7 6 小結
參考文獻
第8章收斂速度可調節的新型值迭代機制
8 1 引言
8 2 問題描述
8 3 新型可調節值迭代框架
8 3 1 新型可調節值迭代演算法推導
8 3 2 新型可調節值迭代演算法性質
8 3 3 加速值迭代演算法的實際設計
8 4 模擬實驗
8 5 小結
參考文獻
第9章融合可調節與穩定值迭代的約束跟蹤控制
9 1 引言
9 2 問題描述
9 3 面向最優跟蹤的可調節值迭代演算法
9 3 1 約束跟蹤問題的可調節值迭代演算法推導
9 3 2 約束跟蹤問題的可調節值迭代演算法性質
9 4 穩定值迭代演算法及演化控制設計
9 4 1 約束跟蹤問題的穩定值迭代演算法推導
9 4 2 約束跟蹤問題的穩定值迭代演化控制
9 5 模擬實驗
9 6 小結
參考文獻
第10章面向非線性零和博弈的演化與增量值迭代
10 1 引言
10 2 問題描述
10 3 面向零和博弈的演化值迭代演算法
10 3 1 零和博弈問題的折扣值迭代演算法推導
10 3 2 零和博弈問題的演化值迭代演算法特性
10 4 面向零和博弈的增量值迭代演算法
10 4 1 考慮歷史迭代信息的值迭代演算法
10 4 2 零和博弈最優調節的增量值迭代演算法
10 4 3 零和博弈最優跟蹤的增量值迭代演算法
10 5 模擬實驗
10 6 小結
參考文獻
後記

詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於PChome商店街私訊告知ISBN或書號，我們即儘速上架。