| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202311*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Python數據科學應用從入門到精通 ISBN:9787302646853 出版社:清華大學 著編譯者:張甜 楊維忠 頁數:466 所在地:中國大陸 *此為代購商品 書號:1584642 可大量預訂,請先連絡。 內容簡介 隨著數據存儲、數據處理等大數據技術的快速發展,數據科學在各行各業得到廣泛的應用。數據清洗、特徵工程、數據可視化、數據挖掘與建模等已成為高校師生和職場人士迎接數字化浪潮、與時俱進提升專業技能的必修課程。本書將「Python課程學習」與「數據科學應用」有機結合,為數字化人才的培養助力。 全書共分13章,內容包括:第1章數據科學應用概述;第2章Python的入門基礎知識;第3章數據清洗;第4∼6章特徵工程介紹,包括特徵選擇、特徵處理和特徵提取;第7章數據可視化應用;第8∼13章介紹6種數據挖掘與建模的方法,分別為線性回歸、Logistic回歸、決策樹、隨機森林、神經網路、RFM分析。 本書既適合作為經濟學、管理學、統計學、金融學、社會學、醫學、電子商務等相關專業的學生學習Python數據科學應用的專業教材或參考書,也適合作為企事業單位數字化人才培養的教科書與工具書。此外,還可以作為職場人士提升數據處理與分析挖掘能力,提高工作效能和績效水平的自學Python數據科學應用的工具書。作者簡介 楊維忠,山東大學經濟學碩士,CPA,十年商業銀行工作經歷,歷任運營、風控、營銷、內控等多個職位,擅長商務建模,精通SPSS、Stata、EViews,編著有《SPSS數據挖掘與案例分析應用實踐》《Stata統計分析與實驗指導》等近十本暢銷書。目錄 第1章 數據科學應用概述1 1 什麼是數據清洗、特徵工程、數據可視化、數據挖掘與建模 1 1 1 數據清洗的概念 1 1 2 特徵工程的概念 1 1 3 數據可視化的概念 1 1 4 數據挖掘與建模的概念 1 2 為什麼要開展數據清洗、特徵工程、數據可視化和數據挖掘與建模 1 2 1 數據清洗、特徵工程的重要性 1 2 2 數據可視化的重要性 1 2 3 數據挖掘與建模的重要性 1 3 為什麼要將Python作為實現工具 1 4 數據清洗、特徵工程、數據可視化和數據挖掘與建模的主要內容 1 4 1 數據清洗的主要內容 1 4 2 特徵工程的主要內容 1 4 3 數據可視化的主要內容 1 4 4 數據挖掘與建模的主要內容 1 5 數據清洗、特徵工程、數據可視化和數據挖掘與建模的應用場景 1 5 1 數據清洗、特徵工程的應用場景 1 5 2 數據可視化的應用場景 1 5 3 數據挖掘與建模的應用場景 1 6 數據清洗、特徵工程和數據可視化的注意事項 1 6 1 數據清洗、特徵工程的注意事項 1 6 2 數據可視化的注意事項 1 7 數據挖掘與建模的注意事項 1 8 習題 第2章 Python入門基礎 2 1 Python概述 2 2 Anaconda平台的下載與安裝 2 2 1 Anaconda平台的下載 2 2 2 Anaconda平台的安裝 2 2 3 Anaconda Prompt(Anaconda3) 2 2 4 Spyder(Anaconda3)的介紹及偏好設置 2 2 5 Spyder(Anaconda3)窗口介紹 2 3 Python的註釋 2 4 基本輸出函數—print()函數 2 5 基本輸入函數—input()函數 2 6 Python的保留字與標識符 2 6 1 Python中的保留字 2 6 2 Python的標識符 2 7 Python的變數 2 8 Python的基本數據類型 2 9 Python的數據運算符 2 10 Python序列的概念及通用操作 2 10 1 索引 2 10 2 切片 2 10 3 相加 2 10 4 相乘 2 10 5 元素檢查 2 10 6 與序列相關的內置函數 2 11 Python列表 2 11 1 列表的基本操作 2 11 2 列表元素的基本操作 2 12 Python元組 2 12 1 元組的基本操作 2 12 2 元組元素的基本操作 2 13 Python字典 2 13 1 字典的基本操作 2 13 2 字典元素的基本操作 2 14 Python集合 2 15 Python字元串 2 16 習題 第3章 數據清洗 3 1 Python數據清洗基礎 3 1 1 Python函數與模塊 3 1 2 numpy模塊數組 3 1 3 pandas模塊序列 3 1 4 pandas模塊數據框 3 1 5 Python流程式控制制語句 3 2 Python數據讀取、合併、寫入 3 2 1 讀取、合併、寫入文本文件(CSV或者TXT) 3 2 2 讀取、合併、寫入Excel數據文件 3 2 3 讀取、合併、寫入Stata數據文件 3 2 4 讀取、合併SPSS數據文件 3 3 Python數據檢索 3 4 Python數據行列處理 3 4 1 刪除變數列、樣本行 3 4 2 更改變數的列名稱、調整變數列順序 3 4 3 改變列的數據格式 3 4 4 多列轉換 3 4 5 數據百分比格式轉換 3 5 Python數據缺失值處理 3 5 1 查看數據集中的缺失值 3 5 2 填充數據集中的缺失值 3 5 3 刪除數據集中的缺失值 3 6 Python數據重複值處理 3 6 1 查看數據集中的重複值 3 6 2 刪除數據集中的重複值 3 7 Python數據異常值處理 3 7 1 運用3δ準則檢測異常值 3 7 2 繪製箱圖檢測異常值 3 7 3 刪除異常值 3 7 4 3δ準則替換異常值 3 7 5 1%/99%分位數替換異常值 3 8 Python數據透視表、描述性分析和交叉表分析 3 8 1 數據透視表 3 8 2 描述性分析 3 8 3 交叉表分析 3 9 習題 第4章 特徵選擇 4 1 特徵選擇的概念、原則及方法 4 1 1 特徵選擇的概念 4 1 2 特徵選擇的原則 4 1 3 特徵選擇的方法 4 2 過濾法—去掉低方差的特徵 4 3 過濾法—單變數特徵選擇 4 3 1 卡方檢驗 4 3 2 相關性分析 4 3 3 方差分析(F檢驗) 4 3 4 互信息 4 4 包裹法—遞歸特徵消除 4 5 嵌入法 4 5 1 隨機森林演算法選擇特徵變數 4 5 2 提升法演算法選擇特徵變數 4 5 3 Logistic回歸演算法選擇特徵變數 4 5 4 線性支持向量機演算法選擇特徵變數 4 6 習題 第5章 特徵處理 5 1 特徵歸一化、特徵標準化、樣本歸一化 5 1 1 特徵歸一化 5 1 2 特徵標準化 5 1 3 樣本歸一化 5 2 特徵等寬分箱和等頻分箱 5 3 特徵決策樹分箱 5 3 1 信息熵 5 3 2 信息增益 5 3 3 增益比率 5 3 4 基尼指數 5 3 5 變數重要性 5 3 6 特徵決策樹分箱的Python實現 5 4 特徵卡方分箱 5 5 WOE(證據權重)和IV(信息價值) 5 5 1 WOE和IV的概念 5 5 2 W 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |