*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202307*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:隨機動態決策理論與應用 ISBN:9787560667492 出版社:西安電子科技大學 著編譯者:胡奇英 叢書名:運籌與管理科學叢書 頁數:272 所在地:中國大陸 *此為代購商品 書號:1553699 可大量預訂,請先連絡。 內容簡介 本書介紹隨機動態決策的理論與應用。全書共14章,分為理論篇和應用篇。第1章∼第6章為理論篇,內容包括離散時間馬爾可夫決策過程(有限階段、無限階段折扣準則、無限階段平均準則),半馬爾可夫決策過程,連續時間馬爾可夫決策過程,強化學習與近似演算法;第7章∼第14章為應用篇,內容包括庫存管理,收益管理,網上拍賣,網上拍賣下的收益管理、庫存管理,技術的採用與選擇,排隊(服務)系統的最優控制,組合證券選擇與風險管理,供應鏈動態管理。 本書適合作為高等院校管理科學、運籌學、自動控制、計算機科學等專業的研究生教材,也可供對動態決策理論、人工智慧諸方面感興趣的研究人員閱讀。目錄 理論篇第1章 有限階段 1 1 單階段決策 1 2 多階段動態決策:確定性 1 3 多階段馬爾可夫決策過程 1 3 1 模型 1 3 2 最優方程與最優策略 1 4 若干隨機動態決策問題 1 4 1 期權的購買與執行問題 1 4 2 最優選擇問題 1 4 3 產品定價問題 1 5 模函數與單調策略 1 5 1 最優策略的單調性 1 5 2 受罰款限制的最優分配問題 習題 參考文獻 第2章 離散時間馬爾可夫決策過程:折扣準則 2 1 模型與折扣最優方程 2 1 1 模型 2 1 2 最優方程 2 2 演算法 2 2 1 逐次逼近法(值迭代法) 2 2 2 策略迭代法 2 2 3 線性規劃法 2 3 應用 2 3 1 最優停止問題 2 3 2 項目管理:Bandit問題 2 4 MDP模型的推廣 2 4 1 一種無界報酬條件 2 4 2 非可數決策集 2 4 3 一般策略集 2 5 期望總報酬準則 2 5 1 模型縮減 2 5 2 報酬函數的有限性 2 5 3 最優值函數的有限性及最優方程 習題 參考文獻 第3章 離散時間馬爾可夫決策過程:平均準則 3 1 平均準則的最優方程 3 1 1 平均準則的最優方程與最優策略 3 1 2 常返性條件 3 1 3 有限MDP 3 2 演算法 3 2 1 逐次逼近法 3 2 2 策略迭代法 3 2 3 線性規劃法 3 3 最優不等式 本章附錄:若干引理 習題 參考文獻 第4章 半馬爾可夫決策過程 4 1 半馬爾可夫決策過程模型 4 1 1 SMDP模型 4 1 2 正則性條件 4 1 3 準則函數 4 2 轉換為離散時間馬爾可夫決策過程 4 2 1 期望折扣總報酬準則 4 2 2 平均準則 4 3 馬爾可夫型SMDP 4 4 模型推廣:報酬函數的一般形式 習題 參考文獻 第5章 連續時間馬爾可夫決策過程 5 1 時齊模型 5 2 期望折扣總報酬準則 5 2 1 折扣準則 5 2 2 期望折扣總報酬準則 5 3 平均準則 5 4 非時齊模型 習題 參考文獻 第6章 強化學習與近似演算法 6 1 強化學習:折扣準則 6 1 1 折扣目標函數值的估計 6 1 2 強化學習演算法 6 1 3 TD(λ) 6 2 強化學習:平均準則 6 2 1 平均準則函數值的估計 6 2 2 平均準則的強化學習演算法 6 3 近似演算法 6 3 1 近似逐次逼近法 6 3 2 近似策略迭代法 習題 參考文獻 應用篇 第7章 庫存管理 7 1 多周期隨機庫存管理問題 7 1 1 多周期庫存管理問題 7 1 2 有限階段期望折扣總費用 7 1 3 短視策略 7 2 無限階段隨機存貯問題 7 2 1 無限階段折扣準則 7 2 2 無限階段平均準則 7 2 3 損失制 7 3 存貯與定價的聯合動態決策 7 3 1 有限階段 7 3 2 無限階段 習題 參考文獻 第8章 收益管理 8 1 價格固定時的容量分配 8 1 1 靜態模型 8 1 2 動態模型 8 1 3 預訂和超訂 8 2 價格動態變化時的多階段容量分配 8 3 連續時間動態定價 8 4 基於Priceline的買方/賣方定價收益 管理問題 8 4 1 買方定價 8 4 2 賣方定價 8 5 房地產市場的政府調控策略:基於收益管理 8 6 收益管理的進一步討論 習題 參考文獻 第9章 網上拍賣 9 1 拍賣簡介 9 2 單物品網上拍賣中的顧客投標策略 9 2 1 問題與模型 9 2 2 IPV下硬性結束規則的一級價格網上拍賣 9 2 3 IPV下軟性結束規則的一級價格網上拍賣 9 2 4 其他類型的網上拍賣 9 3 單階段多物品網上拍賣的收益 習題 參考文獻 第10章 網上拍賣下的收益管理、庫存管理 10 1 網上分批拍賣下的收益管理 10 1 1 問題與模型 10 1 2 最優分配策略的單調性 10 1 3 數值分析 10 2 網上拍賣下的庫存管理 10 2 1 有限階段 10 2 2 折扣準則 10 2 3 平均準則 10 2 4 最優保留價 10 2 5 數值分析 習題 參考文獻 第11章 技術的採用與選擇 11 1 最優更換 11 1 1 有限階段 11 1 2 無限階段折扣準則 11 1 3 平均準則 11 2 技術採用 11 3 基於購買的技術更新問題 11 4 基於自行研發的技術更新問題 11 5 新產品策略與庫存管理 習題 參考文獻 第12章 排隊(服務)系統的最優控制 12 1 排隊系統的到達控制 12 1 1 M/G/1排隊系統的靜態到達率控制 12 1 2 M/M/K排隊系統的動態到達率控制 12 1 3 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |