Python數據分析實戰-思路詳解與案例實踐 羅博煒 9787122449788 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:化學工業
NT$502
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202406*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Python數據分析實戰-思路詳解與案例實踐
ISBN:9787122449788
出版社:化學工業
著編譯者:羅博煒
頁數:272
所在地:中國大陸 *此為代購商品
書號:1653069
可大量預訂,請先連絡。

編輯推薦
適讀人群 :數據分析初學者、數據營銷分析人員、數據產品經理和數據科學相關專業學生。
1 知識點案例化,將不同分析方法融入案例中,培養讀者的數據思維。
2 基於完整的數據分析流程,呈現多種業務場景的應用。
3 雙色印刷,精彩呈現代碼與知識要點。
4 更有基於chatGPT的數據分析實踐。

內容簡介
本書在簡要介紹數據分析的統計學基礎后,結合實例闡釋線性回歸、邏輯回歸、決策樹、隨機森林、聚類分析、主成分分析、關聯規則挖掘等常用演算法的原理與應用,並通過覆蓋諸多業務場景的案例,如零售超市業績評估、廣告營銷渠道分析、網約車運營分析、網站改版分析等,呈現數據分析的思路與方法。最後,本書還探索了ChatGPT在數據分析中的應用。
無論是數據分析初學者、數據營銷分析人員、數據產品經理,還是數據科學相關專業學生,都可通過本書了解並學習實用的數據分析知識和技能。

作者簡介

目錄
第1章 數據分析的統計學基礎 1
1 1 統計學中的一些概念 2
1 1 1 總體與樣本 2
1 1 2 參數與統計量 2
1 1 3 變數的度量類型 3
1 1 4 變數的分佈類型 3
1 1 5 正態分佈 4
1 1 6 Z分數 4
1 2 假設檢驗基礎 6
1 2 1 假設檢驗的基本要點 7
1 2 2 大數定律和中心極限定理 9
1 3 Z檢驗 10
1 3 1 基本原理 10
1 3 2 Python實現Z檢驗 11
1 4 t檢驗 13
1 4 1 單樣本t檢驗 13
1 4 2 雙樣本t檢驗 14
1 5 方差分析 17
1 5 1 基本原理 18
1 5 2 Python 實現方差分析 20
1 6 卡方檢驗 23
1 7 相關分析(相關係數與熱力圖) 24
1 7 1 Pearson相關係數 25
1 7 2 熱力圖 26
1 7 3 相關係數的顯著性檢驗 27
第2章 多元線性回歸實現房價預測 29
2 1 線性回歸 30
2 1 1 簡單線性回歸原理 30
2 1 2 多元線性回歸 31
2 2 Python實現多元線性回歸 33
2 3 模型分析與評估 36
2 3 1 模型的評估指標(R方與調整R方) 36
2 3 2 回歸係數的顯著性檢驗 37
2 3 3 虛擬變數的設置 38
2 3 4 多重共線性的診斷 40
2 3 5 殘差分析 43
2 3 6 線性回歸模型評估小結 48
第3章 邏輯回歸預測電信客戶流失情況 49
3 1 邏輯回歸 50
3 1 1 從相關性分析到邏輯回歸 51
3 1 2 邏輯回歸公式原理 53
3 2 Python中實現邏輯回歸 57
3 3 分類模型的評估 60
3 3 1 模型預測 60
3 3 2 一致對、不一致對與相等對 61
3 3 3 混淆矩陣 63
3 3 4 ROC曲線與AUC值 67
第4章 決策樹實現信貸違約預測 70
4 1 決策樹的原理 71
4 1 1 節點、分支與深度 71
4 1 2 決策樹的分類思想 72
4 1 3 信息熵、條件熵與信息增益 74
4 2 決策樹的演算法 76
4 2 1 ID3演算法與Python實現 77
4 2 2 可視化決策樹(傳統和交互) 77
4 2 3 C4 5演算法與Python實現 80
4 2 4 CART演算法建樹原理 84
4 3 決策樹實現信貸違約預測的具體代碼 86
4 3 1 網格搜索調優 89
4 3 2 優化決策邊界 91
第5章 隨機森林預測寬頻訂閱用戶離網 94
5 1 集成學習簡介 95
5 1 1 概述:Bagging與Boosting 96
5 1 2 Bagging原理與Python實現 97
5 2 隨機森林的原理 100
5 3 隨機森林預測寬頻訂閱用戶離網的具體代碼 103
第6章 深入淺出層次聚類 106
6 1 聚類演算法概述 107
6 1 1 聚類演算法的應用場景 107
6 1 2 聚類演算法的變數特點 107
6 1 3 幾種常用的聚類演算法 108
6 2 聚類演算法的分類邏輯 108
6 2 1 歐氏距離 108
6 2 2 餘弦相似度 109
6 2 3 閔氏距離 110
6 3 層次聚類 110
6 3 1 層次樹怎麼看? 110
6 3 2 點與點、簇與簇之間的距離 113
6 3 3 Python實現層次聚類 117
6 4 聚類模型的評估 120
6 4 1 輪廓係數 120
6 4 2 平方根標準誤差 121
6 4 3 R方 121
6 4 4 評估指標的選擇 121
6 5 Python實現聚類演算法評估 121
6 6 結果分析 123
第7章 K-Means聚類實現客戶分群 124
7 1 K-Means聚類原理 125
7 2 Python實現K-Means聚類 126
7 3 數據轉換方法 127
7 4 模型評估 131
7 5 結果分析 132
第8章 基於不平衡分類演算法的反欺詐模型 134
8 1 不平衡分類背景 135
8 2 欠採樣法 136
8 2 1 隨機欠採樣法 137
8 2 2 Tomek Link法 137
8 3 過採樣法 138
8 3 1 隨機過採樣法 138
8 3 2 SMOTE法 138
8 4 綜合採樣法 139
8 5 Python代碼實戰 140
8 5 1 數據探索 140
8 5 2 過採樣處理 141
8 5 3 決策樹建模 142
8 5 4 結果分析與優化 143
第9章 主成分分析實現客戶信貸評級 145
9 1 PCA中的信息壓縮 146
9 2 主成分分析原理 147
9 2 1 信息壓縮的過程 147
9 2 2 主成分的含義 149
9 3 Python實現主成分分析 150
第10章 Apriori演算法實現智能推薦 155
10 1 常見的推薦演算法 156
10 2 購物籃分析簡介 156
10 3 關聯規則 158
10 3 1 關聯三度 158
10 3 2 Apriori演算法原理 160
10 4 Python實現關聯規則 160
10 4 1 數據探索 160
10 4 2 Apriori實現關聯規則 162
10 4 3 篩選互補品與互斥品 163
10 5 根據關聯規則結果推薦商品 164
10 5 1 以獲得最高的營銷響應率為目標 164
10 5 2 以最大化總體銷售額為目標 165
10 5 3 用戶並未產生消費,為其推薦某樣商品 166
10 6 使用Apriori演算法的注意事項 166
第11章 從變數到指標體系 168
11 1 變數與指標 169
11 2 從單個指標到指標體系 170
第12章 零售超市業績評估 171
12 1 增長率分析法 172
12 2 比例分析法 175
12 3 投入產出比法 177
12 4 評估小結 178
第13章 廣告營銷渠道分析 179
13 1 漏斗分析法 180
13 2 整體結構分析法 183
13 3 渠道分析小結 184
第14章 網約車司機單日工作情況分析 185
14 1 單維度分類 187
14 2 兩維度分類 189
14 3 數據解讀小結 196
第15章 網約車城市運營情況分析 198
15 1 多維度分析法 199
15 2 指標關係梳理 200
15 3 多指標分析順序 201
15 3 1 各城市完單情況分析 201
15 3 2 各城市過程指標分析 203
15 3 3 轉化率分析 204
15 3 4 供需端分析 208
15 4 多維度分析小結 215
第16章 AB測試-教育類網站改版分析 216
16 1 AB測試原理 217
16 2 問題探索 219
16 3 改版效果檢測 223
16 3 1 分層抽樣函數 224
16 3 2 主頁點擊率 226
16 3 3 課程詳情頁註冊率和瀏覽時長 226
16 3 4 課程學習頁完課率 228
16 3 5 分析匯總 229
16 4 AB測試的不足 229
第17章 用戶價值分析 232
17 1 RFM分析基礎 233
17 1 1 R、F、M的打分方式 233
17 1 2 RFM模型的使用 235
17 2 Python實現RFM模型 235
17 2 1 計算R值 237
17 2 2 計算F值 238
17 2 3 計算M值 238
17 2 4 維度打分 239
17 2 5 客戶分層 240
17 3 RFM模型指導實際業務 241
17 3 1 F、M 矩陣分析 242
17 3 2 識別對價格敏感的用戶 243
17 3 3 識別囤貨用戶 244
17 3 4 把R也考慮進來 245
17 4 RFM小結 245
第18章 用戶留存分析 247
18 1 同期群分析基礎 248
18 1 1 從同期群分析表看餐廳經營狀況 248
18 1 2 從另一個視角看餐廳經營狀況 249
18 2 Python實現同期群分析 250
18 2 1 神奇的 intersect1d 和 setdiff1d 250
18 2 2 單月新增和留存情況 251
18 2 3 循環構建每個月的新增和留存 253
18 2 4 延伸應用 257
第19章 ChatGPT在數據分析領域的應用 259
19 1 ChatGPT的提問框架 260
19 2 用ChatGPT做數據分析 261
19 2 1 GPT處理數據 261
19 2 2 GPT實現假設檢驗 264
19 2 3 GPT實現分類演算法 267
19 3 用ChatGPT分析業務問題 269
19 4 ChatGPT應用小結 272

前言/序言
在這個數據驅動的時代,數據分析已經成為社會生產與經營中不可或缺的一部分。如何善用數據,挖掘其中的規律與趨勢,不僅是管理者與決策者最為關注的,更是數據科學工作者所必備的技能。
本書精選諸多有代表性的行業案例,將相關演算法原理解讀與實際應用相結合,旨在幫助讀者快速學習數據分析的核心技法與精髓,在不同領域中更準確地發掘數據背後所隱含的巨大價值。
本書共19章,在介紹數據分析必備的統計學基礎之上,以各種實例演示數據分析常用演算法,如線性回歸、邏輯回歸、決策樹、隨機森林、聚類分析、主成分分析、關聯規則挖掘等。除此以外,本書還關注數據分析在多種業務領域的實踐,從零售超市業績評估、廣告營銷渠道分析,到網約車運營分析、網站改版分析等。這些不同領域的案例呈現了數據分析的工作思路與方法,無論讀者是有學習需求,還是想實戰演練,本書都會提供有益的支持。
在最後一章中,筆者還特別介紹了ChatGPT在數據分析中的應用。相信這一章能為讀者學習與實踐提供更多的思路和靈感。
1 本書的讀者對象
數據分析初學者;
數據營銷分析人員;
數據產品經理;
高校學生。
2 如何閱讀本書
數據分析離不開編程工具的支持,為方便讀者學習,筆者提供了數據分析相關的Python基礎、第三方庫Numpy和Pandas的使用(數據處理與清洗),以及探索性數據分析與繪圖(變數處理與報表製作)等編程相關內容的電子文檔。因此,針對不同的讀者,除正序閱讀外,本書還可有以下三種閱讀方式。
(1)初級數據工作者:閱讀完電子版的Python基礎后,直接跳到第11章進行閱讀,以實際業務案例為導向,遇到不懂或遺忘的知識點再往前翻看。
(2)具備Python編程基礎和統計學基礎的讀者:直接從第2章的數據分析實戰案例開始讀起,加深對相關分析演算法的應用理解。
(3)無任何基礎的初學者:從電子版的Python基礎內容開始,然後逐章學習,由基礎到實踐,系統地學習數據分析。
3 勘誤和支持
由於筆者水平有限,書中難免會出現不

規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理