*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202409*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:基於強化學習的無人系統智能決策 ISBN:9787118134957 出版社:國防工業 著編譯者:張建東 叢書名:人工智慧理論演算法與工程技術叢書 頁數:266 所在地:中國大陸 *此為代購商品 書號:1688720 可大量預訂,請先連絡。 內容簡介 無人系統正逐漸成為現代社會各領域中的重要組成部分。自主決策能力是無人系統智能化的重要體現,也是無人系統智能化執行任務的關鍵技術。強化學習是當前人工智慧技術中無人系統實現從環境中自主學習行為策略的有效途徑,經過近些年的研究,強化學習的演算法研究取得了豐富的成果,涵蓋從單智能體到多智能體,從離散狀態到連續空間,從低維到高維的決策建模,能夠適應無人系統的各種任務決策的建模。本書從工程應用的視角出發,分析了強化學習進行無人系統自主決策的一般性方法,主要研究基於強化學習實現無人系統執行空戰決策和集群協同等各類任務環節的智能決策,實現從任務背景到模擬驗證。本書內容儘可能結合工程應用背景,以期對該領域的工程實踐具有較好的參考性。 本書不僅適用於強化學習應用建模的初學者閱讀,也可作為從事無人系統工作的科研人員及高校師生的教材和主要參考書籍使用。目錄 第1章 1緒論1 1 引言 1 2 無人作戰系統 1 2 1 空中無人作戰系統 1 2 2 地面無人作戰系統 1 2 3 海上無人作戰系統 1 3 無人作戰系統發展趨勢 1 4 強化學習與無人系統 第2章 1強化學習理論 2 1 強化學習的概念 2 1 1 基本概念 2 1 2 強化學習的要素 2 2 馬爾可夫決策過程 2 2 1 定義 2 2 2 基於值函數的求解方法 2 2 3 基於策略的求解方法 2 3 部分可觀測的馬爾可夫決策過程 2 3 1 定義 2 3 2 求解方法 2 4 深度強化學習 2 4 1 定義 2 4 2 主要演算法框架 2 5 分層強化學習 2 5 1 半馬爾可夫決策過程 2 5 2 分層強化學習的主要演算法 2 6 多智能體強化學習 第3章 基於POMDP的自主跟蹤路徑規劃 3 1 引言 3 2 基於:POMDP的無人機自主跟蹤路徑規劃建模 3 2 1 問題背景 3 2 2 簡單機動目標的自主跟蹤路徑規劃模型 3 2 3 複雜機動目標的自主跟蹤路徑規劃模型 3 3 自主跟蹤路徑規劃模型的有限行動集演算法 3 3 1 近似求解的思路 3 3 2 演算法流程 3 4 模擬分析 3 4 1 目標簡單機動的模擬分析 3 4 2 目標複雜機動的模擬分析 第4章 基於DQN的實時避障路徑規劃 4 1 引言 4 2 無人機路徑規劃問題建模 4 2 1 無人機運動模型 4 2 2 實時路徑規劃約束 4 3 無人機實時路徑規劃決策模型 4 3 1 馬爾可夫決策過程 4 3 2 基於LSTM的無人機實時路徑規劃演算法 4 4 模擬驗證 4 4 1 場景設計 4 4 2 模擬實驗 4 4 3 實驗分析 第5章 單無人機智能空戰機動決策 5 1 引言 5 2 單無人機智能空戰機動決策框架 5 2 1 空戰模型 5 2 2 基於強化學習的空戰機動決策模型框架 5 2 3 關鍵技術問題 5 3 基於FQL的智能空戰機動決策方法 5 3 1 FQL演算法 5 3 2 基於優勢函數的態勢評估模型 5 3 3 空戰機動決策的動態模糊Q學習建模 5 3 4 模擬訓練與分析 5 4 基於DQN的智能空戰機動決策方法 5 4 1 基於武器攻擊區的態勢評估模型 5 4 2 空戰機動決策的DQN模型的設計 5 4 3 機動決策DQN模型的訓練方法 5 4 4 模擬分析 5 5 基於DDPG的智能空戰機動決策方法 5 5 1 DDPG演算法 5 5 2 空戰機動決策的DDPG模型的設計 5 5 3 空戰機動決策DDPG模型的訓練方法 5 5 4 模擬分析 第6章 多無人機協同智能空戰機動決策 6 1 引言 6 2 多機空戰環境模型 6 2 1 多機空戰環境模型 6 2 2 基於MDRL的多無人機協同空戰機動決策模型框架 6 2 3 關鍵技術問題 6 3 協同空戰中的信息交互 6 3 1 分散式系統中的信息一致性 6 3 2 雙向循環神經網路 6 4 協同空戰目標分配 6 4 1 目標分配模型 6 4 2 目標分配方法 6 5 基於MDRL的多無人機協同智能空戰機動決策方法 6 5 1 策略協調機制 6 5 2 基於雙向通信的學習機制 6 5 3 協同空戰機動決策演算法模型 6 5 4 模型訓練方法 6 6 模擬與分析 6 6 1 平台和參數設定 6 6 2 模型訓練與測試 6 7 空戰機動決策模擬驗證系統 6 7 1 系統框架 6 7 2 空戰環境模擬系統 6 7 3 無人機自學習系統 6 7 4 有人機操控模擬系統 6 7 5 UDP通信 6 7 6 系統模擬 第7章 無人機多維空戰決策 7 1 引言 7 2 空戰決策維度分解 7 2 1 雷達開關策略模型 7 2 2 主動干擾策略模型 7 2 3 隊形轉換策略模型 7 2 4 目標探測策略模型 7 2 5 武器選擇與目標打擊策略模型 7 2 6 目標追蹤策略模型 7 2 7 干擾規避策略模型 7 3 空戰多維決策模型 7 3 1 元策略模型訓練演算法 7 3 2 空戰多維決策演算法 7 4 模擬與分析 7 4 1 實驗環境設定 7 4 2 定義想定任務 7 4 3 跟蹤元策略訓練 7 4 4 干擾規避元策略訓練 7 4 5 分層框架構建 7 4 6 結果分析 第8章 無人機集群任務決策 8 1 引言 8 2 無人機集群任務系統模型 8 2 1 無人機的運動控制模型 8 2 2 無人機集群的信息交互模型 8 3 無人機集群的自主聚集任務決策 8 3 1 任務場景 8 3 2 DDQN演算法 8 3 3 演算法的優化設計 8 3 4 狀態空間設計 8 3 5 獎勵函數設計 8 3 6 模擬與分析 8 4 無人機集群自主編隊保持任務決策 8 4 1 任務場景 8 4 2 無人機集群編隊的常見隊形模型 8 4 3 MADDPG演算法 8 4 4 狀態空間設計 8 4 5 獎勵函數設計 8 4 6 模擬與分析 8 5 無人機集群協同圍捕任務決策 8 5 1 任務場景 8 5 2 TD3演算法 8 5 3 狀態空間設計 8 5 4 獎勵函數 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |