數據挖掘實用案例分析 (第2版) 趙衛東 董亮 9787302658092 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
NT$566
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:數據挖掘實用案例分析 (第2版)
ISBN:9787302658092
出版社:清華大學
著編譯者:趙衛東 董亮
頁數:272
所在地:中國大陸 *此為代購商品
書號:1630059
可大量預訂,請先連絡。

內容簡介

數據挖掘已經廣泛應用於各行各業,並推動了商務數據分析的興起。本書結合項目實踐,首先對數據挖掘的核心問題進行總結,討論數據挖掘過程的主要步驟。在此基礎上,使用Python語言詳細地分析數據可視化、隨機森林、GBDT、XGBoost、AdaCostBoost、邏輯回歸等在醫療保險稽核、淡水質量預測、彈幕情感分析、機器學習書籍市場分析、慢性腎臟病狀態預測、行車記錄儀銷量分析、商務酒店競爭分析等典型領域的應用。 全書內容深入淺出,案例生動形象,應用性強,可以作為高等學校相關專業「數據挖掘」「商務數據分析」等課程的實驗和實訓教材,也適合對數據分析感興趣的廣大讀者使用。

目錄

第1章 數據分析基礎
1 1 業務理解
1 2 數據理解
1 3 數據質量問題與預處理
1 4 數據分析常見陷阱
1 5 數據分析方法的選擇
1 5 1 分類演算法
1 5 2 聚類演算法
1 5 3 關聯分析
1 5 4 回歸分析
1 5 5 深度學習
1 5 6 統計方法
1 6 數據分析結果的評價
1 6 1 分類演算法的評價
1 6 2 聚類結果的評價
1 6 3 關聯分析的評價
1 6 4 回歸分析結果的評價
1 7 數據分析團隊的組建
1 7 1 項目經理
1 7 2 業務專家
1 7 3 數據工程師
1 7 4 數據建模人員
1 7 5 可視化人員
1 7 6 評估人員
1 8 數據分析人才培養的難題
1 8 1 數理要求高
1 8 2 跨學科綜合能力欠缺
1 8 3 國內技術資料少
1 8 4 實踐機會少
思考題
第2章 Anaconda的安裝與使用
2 1 Anaconda的下載與安裝
2 2 配置Python庫
2 3 創建自定義新環境
2 4 集成開發環境的使用
2 5 搭建GPU環境
思考題
第3章 醫療保險稽核
3 1 數據預處理
3 1 1 特徵選擇
3 1 2 數據清洗
3 1 3 數據離散化
3 1 4 特徵值處理
3 1 5 數據平衡
3 1 6 樣本權重係數設置
3 1 7 數據轉換
3 2 醫療保險稽核建模和評估
3 3 結果分析
思考題
第4章 機器學習書籍市場分析
4 1 數據獲取
4 2 數據預處理
4 3 市場總體分析
4 4 書籍暢銷因素分析
4 4 1 隨機森林模型
4 4 2 商品評論詞頻分析
4 4 3 商品評論主題分析
4 4 4 其他值得關注的問題
4 5 Apriori關聯分析
4 6 機器學習書聚類分析
4 7 給電商平台上架圖書的建議
思考題
第5章 預測淡水質量
5 1 數據清洗處理
5 1 1 缺失值的處理
5 1 2 特徵數值分佈
5 1 3 異常值檢測
5 1 4 相關性檢驗
5 1 5 數據離散化
5 1 6 標籤編碼
5 1 7 採樣平衡
5 2 模型的訓練
5 2 1 模型訓練與預測
5 2 2 模型的優化
5 3 模型評估
思考題
第6章 彈幕情感分析
6 1 數據收集
6 2 數據預處理
6 2 1 去除無效內容
6 2 2 分詞和詞性標註
6 2 3 去除停用詞
6 2 4 主題詞提取
6 2 5 去除低頻詞
6 2 6 編碼
6 2 7 標註
6 2 8 獲取詞向量
6 3 情感分析
6 3 1 基於SnowNLP庫的情感分析方法
6 3 2 基於機器學習的情感分析方法
思考題
第7章 海底撈運營分析
7 1 業務背景分析
7 2 數據抓取
7 3 數據預處理
7 4 店鋪經營分析
7 4 1 影響海底撈運營的關鍵因素分析
7 4 2 店鋪選址分析
7 4 3 菜品關聯分析
7 4 4 用戶評論與評分分析
7 4 5 顧客情感分析
思考題
第8章 慢性腎臟病狀態預測
8 1 業務背景分析
8 2 數據收集
8 3 數據探索
8 3 1 CKD_rate和CKD_stage分佈
8 3 2 醫院
8 3 3 性別
8 3 4 相關遺傳病史
8 3 5 血指標
8 3 6 eGFR
8 4 數據預處理
8 4 1 數據清洗
8 4 2 數據編碼
8 4 3 數據離散化
8 4 4 數據平衡
8 4 5 特徵重要性分析
8 5 慢性腎臟病狀態預測分析
8 5 1 邏輯回歸
8 5 2 決策樹
8 5 3 隨機森林
8 5 4 XGBoost
8 5 5 支持向量機
8 5 6 神經網路
8 6 參數調節
8 7 模型評估
8 8 慢性腎臟病聚類分析
8 9 慢性腎臟病關聯分析
8 10 慢性腎臟病回歸分析
思考題
第9章 行車記錄儀銷量分析
9 1 業務背景分析
9 2 數據說明
9 3 數據預處理
9 3 1 數據清洗
9 3 2 離散數據編碼
9 3 3 數據離散化
9 3 4 特徵重要性評估
9 3 5 數據平衡
9 4 行車記錄儀銷量分析
9 5 行車記錄儀聚類分析
9 6 行車記錄儀關聯分析
9 7 行車記錄儀回歸分析
思考題
第10章 商務酒店競爭分析
10 1 業務背景分析
10 2 數據提取
10 3 數據預處理
10 3 1 數據初步篩選
10 3 2 分詞
10 3 3 關鍵詞提取
10 4 數據分析
10 4 1 客戶情感分析
10 4 2 結果分析
10 5 不同酒店的競爭分析
10 5 1 酒店評分比較
10 5 2 客戶吸引力對比
10 5 3 不同酒店客戶情感對比
思考題
第11章 常見機器學習演算法加速
11 1 使用Intel OneAPI加速
11 1 1 數據預處理
11 1 2 數據集劃分與建模預測
11 1 3 模型評估
11 2 不使用Intel OneAPI的方案
11 2 1 數據集劃分與建模預測
11 2 2 模型評估
11 3 加速與否的對比分析
思考題
第12章 綜合實訓: 銀行信用卡欺詐與拖欠行為分析
12 1 用戶信用等級影響因素
12 1 1 客戶信
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理