目前的購物車是空的!
此商品參與的優惠活動
商品庫存不足留言
編輯推薦 適讀人群 :數據分析初學者、數據營銷分析人員、數據產品經理和數據科學相關專業學生。1 知識點案例化,將不同分析方法融入案例中,培養讀者的數據思維。2 基於完整的數據分析流程,呈現多種業務場景的應用。3 雙色印刷,精彩呈現代碼與知識要點。4 更有基於chatGPT的數據分析實踐。
內容簡介本書在簡要介紹數據分析的統計學基礎后,結合實例闡釋線性回歸、邏輯回歸、決策樹、隨機森林、聚類分析、主成分分析、關聯規則挖掘等常用演算法的原理與應用,並通過覆蓋諸多業務場景的案例,如零售超市業績評估、廣告營銷渠道分析、網約車運營分析、網站改版分析等,呈現數據分析的思路與方法。最後,本書還探索了ChatGPT在數據分析中的應用。無論是數據分析初學者、數據營銷分析人員、數據產品經理,還是數據科學相關專業學生,都可通過本書了解並學習實用的數據分析知識和技能。
作者簡介無
目錄第1章 數據分析的統計學基礎 11 1 統計學中的一些概念 21 1 1 總體與樣本 21 1 2 參數與統計量 21 1 3 變數的度量類型 31 1 4 變數的分佈類型 31 1 5 正態分佈 41 1 6 Z分數 41 2 假設檢驗基礎 61 2 1 假設檢驗的基本要點 71 2 2 大數定律和中心極限定理 91 3 Z檢驗 101 3 1 基本原理 101 3 2 Python實現Z檢驗 111 4 t檢驗 131 4 1 單樣本t檢驗 131 4 2 雙樣本t檢驗 141 5 方差分析 171 5 1 基本原理 181 5 2 Python 實現方差分析 201 6 卡方檢驗 231 7 相關分析(相關係數與熱力圖) 241 7 1 Pearson相關係數 251 7 2 熱力圖 261 7 3 相關係數的顯著性檢驗 27第2章 多元線性回歸實現房價預測 292 1 線性回歸 302 1 1 簡單線性回歸原理 302 1 2 多元線性回歸 312 2 Python實現多元線性回歸 332 3 模型分析與評估 362 3 1 模型的評估指標(R方與調整R方) 362 3 2 回歸係數的顯著性檢驗 372 3 3 虛擬變數的設置 382 3 4 多重共線性的診斷 402 3 5 殘差分析 432 3 6 線性回歸模型評估小結 48第3章 邏輯回歸預測電信客戶流失情況 493 1 邏輯回歸 503 1 1 從相關性分析到邏輯回歸 513 1 2 邏輯回歸公式原理 533 2 Python中實現邏輯回歸 573 3 分類模型的評估 603 3 1 模型預測 603 3 2 一致對、不一致對與相等對 613 3 3 混淆矩陣 633 3 4 ROC曲線與AUC值 67第4章 決策樹實現信貸違約預測 704 1 決策樹的原理 714 1 1 節點、分支與深度 714 1 2 決策樹的分類思想 724 1 3 信息熵、條件熵與信息增益 744 2 決策樹的演算法 764 2 1 ID3演算法與Python實現 774 2 2 可視化決策樹(傳統和交互) 774 2 3 C4 5演算法與Python實現 804 2 4 CART演算法建樹原理 844 3 決策樹實現信貸違約預測的具體代碼 864 3 1 網格搜索調優 894 3 2 優化決策邊界 91第5章 隨機森林預測寬頻訂閱用戶離網 945 1 集成學習簡介 955 1 1 概述:Bagging與Boosting 965 1 2 Bagging原理與Python實現 975 2 隨機森林的原理 1005 3 隨機森林預測寬頻訂閱用戶離網的具體代碼 103第6章 深入淺出層次聚類 1066 1 聚類演算法概述 1076 1 1 聚類演算法的應用場景 1076 1 2 聚類演算法的變數特點 1076 1 3 幾種常用的聚類演算法 1086 2 聚類演算法的分類邏輯 1086 2 1 歐氏距離 1086 2 2 餘弦相似度 1096 2 3 閔氏距離 1106 3 層次聚類 1106 3 1 層次樹怎麼看? 1106 3 2 點與點、簇與簇之間的距離 1136 3 3 Python實現層次聚類 1176 4 聚類模型的評估 1206 4 1 輪廓係數 1206 4 2 平方根標準誤差 1216 4 3 R方 1216 4 4 評估指標的選擇 1216 5 Python實現聚類演算法評估 1216 6 結果分析 123第7章 K-Means聚類實現客戶分群 1247 1 K-Means聚類原理 1257 2 Python實現K-Means聚類 1267 3 數據轉換方法 1277 4 模型評估 1317 5 結果分析 132第8章 基於不平衡分類演算法的反欺詐模型 1348 1 不平衡分類背景 1358 2 欠採樣法 1368 2 1 隨機欠採樣法 1378 2 2 Tomek Link法 1378 3 過採樣法 1388 3 1 隨機過採樣法 1388 3 2 SMOTE法 1388 4 綜合採樣法 1398 5 Python代碼實戰 1408 5 1 數據探索 1408 5 2 過採樣處理 1418 5 3 決策樹建模 1428 5 4 結果分析與優化 143第9章 主成分分析實現客戶信貸評級 1459 1 PCA中的信息壓縮 1469 2 主成分分析原理 1479 2 1 信息壓縮的過程 1479 2 2 主成分的含義 1499 3 Python實現主成分分析 150第10章 Apriori演算法實現智能推薦 15510 1 常見的推薦演算法 15610 2 購物籃分析簡介 15610 3 關聯規則 15810 3 1 關聯三度 15810 3 2 Apriori演算法原理 16010 4 Python實現關聯規則 16010 4 1 數據探索 16010 4 2 Apriori實現關聯規則 16210 4 3 篩選互補品與互斥品 16310 5 根據關聯規則結果推薦商品 16410 5 1 以獲得最高的營銷響應率為目標 16410 5 2 以最大化總體銷售額為目標 16510 5 3 用戶並未產生消費,為其推薦某樣商品 16610 6 使用Apriori演算法的注意事項 166第11章 從變數到指標體系 16811 1 變數與指標 16911 2 從單個指標到指標體系 170第12章 零售超市業績評估 17112 1 增長率分析法 17212 2 比例分析法 17512 3 投入產出比法 17712 4 評估小結 178第13章 廣告營銷渠道分析 17913 1 漏斗分析法 18013 2 整體結構分析法 18313 3 渠道分析小結 184第14章 網約車司機單日工作情況分析 18514 1 單維度分類 18714 2 兩維度分類 18914 3 數據解讀小結 196第15章 網約車城市運營情況分析 19815 1 多維度分析法 19915 2 指標關係梳理 20015 3 多指標分析順序 20115 3 1 各城市完單情況分析 20115 3 2 各城市過程指標分析 20315 3 3 轉化率分析 20415 3 4 供需端分析 20815 4 多維度分析小結 215第16章 AB測試-教育類網站改版分析 21616 1 AB測試原理 21716 2 問題探索 21916 3 改版效果檢測 22316 3 1 分層抽樣函數 22416 3 2 主頁點擊率 22616 3 3 課程詳情頁註冊率和瀏覽時長 22616 3 4 課程學習頁完課率 22816 3 5 分析匯總 22916 4 AB測試的不足 229第17章 用戶價值分析 23217 1 RFM分析基礎 23317 1 1 R、F、M的打分方式 23317 1 2 RFM模型的使用 23517 2 Python實現RFM模型 23517 2 1 計算R值 23717 2 2 計算F值 23817 2 3 計算M值 23817 2 4 維度打分 23917 2 5 客戶分層 24017 3 RFM模型指導實際業務 24117 3 1 F、M 矩陣分析 24217 3 2 識別對價格敏感的用戶 24317 3 3 識別囤貨用戶 24417 3 4 把R也考慮進來 24517 4 RFM小結 245第18章 用戶留存分析 24718 1 同期群分析基礎 24818 1 1 從同期群分析表看餐廳經營狀況 24818 1 2 從另一個視角看餐廳經營狀況 24918 2 Python實現同期群分析 25018 2 1 神奇的 intersect1d 和 setdiff1d 25018 2 2 單月新增和留存情況 25118 2 3 循環構建每個月的新增和留存 25318 2 4 延伸應用 257第19章 ChatGPT在數據分析領域的應用 25919 1 ChatGPT的提問框架 26019 2 用ChatGPT做數據分析 26119 2 1 GPT處理數據 26119 2 2 GPT實現假設檢驗 26419 2 3 GPT實現分類演算法 26719 3 用ChatGPT分析業務問題 26919 4 ChatGPT應用小結 272
前言/序言在這個數據驅動的時代,數據分析已經成為社會生產與經營中不可或缺的一部分。如何善用數據,挖掘其中的規律與趨勢,不僅是管理者與決策者最為關注的,更是數據科學工作者所必備的技能。本書精選諸多有代表性的行業案例,將相關演算法原理解讀與實際應用相結合,旨在幫助讀者快速學習數據分析的核心技法與精髓,在不同領域中更準確地發掘數據背後所隱含的巨大價值。本書共19章,在介紹數據分析必備的統計學基礎之上,以各種實例演示數據分析常用演算法,如線性回歸、邏輯回歸、決策樹、隨機森林、聚類分析、主成分分析、關聯規則挖掘等。除此以外,本書還關注數據分析在多種業務領域的實踐,從零售超市業績評估、廣告營銷渠道分析,到網約車運營分析、網站改版分析等。這些不同領域的案例呈現了數據分析的工作思路與方法,無論讀者是有學習需求,還是想實戰演練,本書都會提供有益的支持。在最後一章中,筆者還特別介紹了ChatGPT在數據分析中的應用。相信這一章能為讀者學習與實踐提供更多的思路和靈感。1 本書的讀者對象數據分析初學者;數據營銷分析人員;數據產品經理;高校學生。2 如何閱讀本書數據分析離不開編程工具的支持,為方便讀者學習,筆者提供了數據分析相關的Python基礎、第三方庫Numpy和Pandas的使用(數據處理與清洗),以及探索性數據分析與繪圖(變數處理與報表製作)等編程相關內容的電子文檔。因此,針對不同的讀者,除正序閱讀外,本書還可有以下三種閱讀方式。(1)初級數據工作者:閱讀完電子版的Python基礎后,直接跳到第11章進行閱讀,以實際業務案例為導向,遇到不懂或遺忘的知識點再往前翻看。(2)具備Python編程基礎和統計學基礎的讀者:直接從第2章的數據分析實戰案例開始讀起,加深對相關分析演算法的應用理解。(3)無任何基礎的初學者:從電子版的Python基礎內容開始,然後逐章學習,由基礎到實踐,系統地學習數據分析。3 勘誤和支持由於筆者水平有限,書中難免會出現不