隨機動態決策理論與應用胡奇英 9787560667492 【台灣高等教育出版社】

Name: 隨機動態決策理論與應用 胡奇英 9787560667492 【台灣高等教育出版社】
Brand: abooksthep
Price: 299.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：西安電子科技大學

NT$299

商品編號:

供貨狀況: 尚有庫存

加入最愛

商品介紹

*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202307*若逾兩年請先於私訊洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：隨機動態決策理論與應用
ISBN：9787560667492
出版社：西安電子科技大學
著編譯者：胡奇英
叢書名：運籌與管理科學叢書
頁數：272
所在地：中國大陸 *此為代購商品
書號：1553699
可大量預訂，請先連絡。

內容簡介

本書介紹隨機動態決策的理論與應用。全書共14章，分為理論篇和應用篇。第1章∼第6章為理論篇，內容包括離散時間馬爾可夫決策過程（有限階段、無限階段折扣準則、無限階段平均準則），半馬爾可夫決策過程，連續時間馬爾可夫決策過程，強化學習與近似演算法；第7章∼第14章為應用篇，內容包括庫存管理，收益管理，網上拍賣，網上拍賣下的收益管理、庫存管理，技術的採用與選擇，排隊（服務）系統的最優控制，組合證券選擇與風險管理，供應鏈動態管理。本書適合作為高等院校管理科學、運籌學、自動控制、計算機科學等專業的研究生教材，也可供對動態決策理論、人工智慧諸方面感興趣的研究人員閱讀。

理論篇
第1章有限階段
1 1 單階段決策
1 2 多階段動態決策：確定性
1 3 多階段馬爾可夫決策過程
1 3 1 模型
1 3 2 最優方程與最優策略
1 4 若干隨機動態決策問題
1 4 1 期權的購買與執行問題
1 4 2 最優選擇問題
1 4 3 產品定價問題
1 5 模函數與單調策略
1 5 1 最優策略的單調性
1 5 2 受罰款限制的最優分配問題
習題
參考文獻
第2章離散時間馬爾可夫決策過程：折扣準則
2 1 模型與折扣最優方程
2 1 1 模型
2 1 2 最優方程
2 2 演算法
2 2 1 逐次逼近法(值迭代法)
2 2 2 策略迭代法
2 2 3 線性規劃法
2 3 應用
2 3 1 最優停止問題
2 3 2 項目管理：Bandit問題
2 4 MDP模型的推廣
2 4 1 一種無界報酬條件
2 4 2 非可數決策集
2 4 3 一般策略集
2 5 期望總報酬準則
2 5 1 模型縮減
2 5 2 報酬函數的有限性
2 5 3 最優值函數的有限性及最優方程
習題
參考文獻
第3章離散時間馬爾可夫決策過程：平均準則
3 1 平均準則的最優方程
3 1 1 平均準則的最優方程與最優策略
3 1 2 常返性條件
3 1 3 有限MDP
3 2 演算法
3 2 1 逐次逼近法
3 2 2 策略迭代法
3 2 3 線性規劃法
3 3 最優不等式
本章附錄：若干引理
習題
參考文獻
第4章半馬爾可夫決策過程
4 1 半馬爾可夫決策過程模型
4 1 1 SMDP模型
4 1 2 正則性條件
4 1 3 準則函數
4 2 轉換為離散時間馬爾可夫決策過程
4 2 1 期望折扣總報酬準則
4 2 2 平均準則
4 3 馬爾可夫型SMDP
4 4 模型推廣：報酬函數的一般形式
習題
參考文獻
第5章連續時間馬爾可夫決策過程
5 1 時齊模型
5 2 期望折扣總報酬準則
5 2 1 折扣準則
5 2 2 期望折扣總報酬準則
5 3 平均準則
5 4 非時齊模型
習題
參考文獻
第6章強化學習與近似演算法
6 1 強化學習：折扣準則
6 1 1 折扣目標函數值的估計
6 1 2 強化學習演算法
6 1 3 TD(λ)
6 2 強化學習：平均準則
6 2 1 平均準則函數值的估計
6 2 2 平均準則的強化學習演算法
6 3 近似演算法
6 3 1 近似逐次逼近法
6 3 2 近似策略迭代法
習題
參考文獻
應用篇
第7章庫存管理
7 1 多周期隨機庫存管理問題
7 1 1 多周期庫存管理問題
7 1 2 有限階段期望折扣總費用
7 1 3 短視策略
7 2 無限階段隨機存貯問題
7 2 1 無限階段折扣準則
7 2 2 無限階段平均準則
7 2 3 損失制
7 3 存貯與定價的聯合動態決策
7 3 1 有限階段
7 3 2 無限階段
習題
參考文獻
第8章收益管理
8 1 價格固定時的容量分配
8 1 1 靜態模型
8 1 2 動態模型
8 1 3 預訂和超訂
8 2 價格動態變化時的多階段容量分配
8 3 連續時間動態定價
8 4 基於Priceline的買方／賣方定價收益
管理問題
8 4 1 買方定價
8 4 2 賣方定價
8 5 房地產市場的政府調控策略：基於收益管理
8 6 收益管理的進一步討論
習題
參考文獻
第9章網上拍賣
9 1 拍賣簡介
9 2 單物品網上拍賣中的顧客投標策略
9 2 1 問題與模型
9 2 2 IPV下硬性結束規則的一級價格網上拍賣
9 2 3 IPV下軟性結束規則的一級價格網上拍賣
9 2 4 其他類型的網上拍賣
9 3 單階段多物品網上拍賣的收益
習題
參考文獻
第10章網上拍賣下的收益管理、庫存管理
10 1 網上分批拍賣下的收益管理
10 1 1 問題與模型
10 1 2 最優分配策略的單調性
10 1 3 數值分析
10 2 網上拍賣下的庫存管理
10 2 1 有限階段
10 2 2 折扣準則
10 2 3 平均準則
10 2 4 最優保留價
10 2 5 數值分析
習題
參考文獻
第11章技術的採用與選擇
11 1 最優更換
11 1 1 有限階段
11 1 2 無限階段折扣準則
11 1 3 平均準則
11 2 技術採用
11 3 基於購買的技術更新問題
11 4 基於自行研發的技術更新問題
11 5 新產品策略與庫存管理
習題
參考文獻
第12章排隊(服務)系統的最優控制
12 1 排隊系統的到達控制
12 1 1 M／G／1排隊系統的靜態到達率控制
12 1 2 M／M／K排隊系統的動態到達率控制
12 1 3
詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於PChome商店街私訊告知ISBN或書號，我們即儘速上架。