*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202409*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:數據科學工程實踐 ISBN:9787121488481 出版社:電子工業 著編譯者:郭繼東 叢書名:新工科新商科大數據與商務智能系列 頁數:415 所在地:中國大陸 *此為代購商品 書號:1686380 可大量預訂,請先連絡。 內容簡介 本書是高等學校開設數據科學導論或工程實踐等課程的配套用書。本書不僅介紹了數據科學的基礎知識,還特別引入了探索性數據分析流程的相關內容,主要包括實踐平台配置、數據預處理、數據存儲與管理、探索性數據分析、單模型學習演算法、集成學習演算法和數據可視化等;精心設計其中的函數應用實踐和綜合應用實踐,前者聚焦具體函數的解釋和應用,後者致力於實際問題解決思路的探討。讀者可以由淺入深地了解相關理論,逐步完成相關實驗內容,增強理論和實踐的連貫性認知,培養數據思維和動手實踐能力。 本書可作為高等學校各相關專業的數據科學導論或實踐等課程的配套教材,也可供對數據科學感興趣的讀者閱讀。目錄 第1章 數據科學概述1 1 數據科學簡介 1 1 1 基本概念及發展歷史 1 1 2 特點及應用領域 1 1 3 數據科學的過程 1 2 Python的安裝 1 3 常用工具包概述 1 4 Anaconda3的安裝 1 5 Jupyter Notebook的使用 1 5 1 Jupyter Notebook簡介 1 5 2 Jupyter Notebook的啟動 1 5 3 新手如何快速上手Jupyter Notebook 1 6 本章小結 課後習題 第2章 數據預處理 2 1 NumPy數據處理及運算 2 1 1 NumPy的安裝 2 1 2 創建N維數組 2 1 3 NumPy切片和索引 2 1 4 NumPy數組操作 2 1 5 數學函數 2 1 6 統計函數 2 1 7 排序函數 2 1 8 直方圖函數 2 2 Pandas基礎 2 2 1 數據快捷載入 2 2 2 Pandas的數據結構 2 3 非數值數據轉換 2 3 1 map()函數 2 3 2 One-Hot編碼 2 4 數據清洗 2 4 1 缺失值處理 2 4 2 錯誤數據替換 2 4 3 數據去重 2 4 4 數據合併連接 2 4 5 數據分組及聚合 2 5 本章小結 課後習題 第3章 數據存儲與管理 3 1 概述 3 1 1 數據存儲的概念 3 1 2 數據管理技術的概念 3 1 3 資料庫的概念 3 1 4 新型數據管理系統 3 2 關係資料庫 3 2 1 關係數據模型 3 2 2 應用舉例 3 3 分散式文件系統 3 3 1 HDFS的概念及特點 3 3 2 HDFS數據文件存儲 3 3 3 HDFS的結構及組件 3 3 4 HDFS的讀/寫操作 3 3 5 Python訪問HDFS 3 4 分散式資料庫 3 4 1 HBase的特點 3 4 2 HBase相關概念 3 4 3 HBase架構 3 4 4 Python操作HBase 3 5 流數據 3 5 1 流數據概述 3 5 2 流數據模型 3 5 3 流數據處理系統 3 6 本章小結 課後習題 第4章 探索性數據分析 4 1 EDA簡介 4 2 特徵創建 4 3 維度約簡 4 3 1 為什麼要降維 4 3 2 基於特徵轉換的降維 4 3 3 基於特徵選擇的降維 4 3 4 基於特徵組合的降維 4 4 異常值檢測及處理 4 4 1 單變數異常檢測 4 4 2 OneClassSVM 4 4 3 EllipticEnvelope 4 5 評價函數 4 5 1 多標籤分類 4 5 2 二分類 4 5 3 回歸 4 6 測試和驗證 4 7 交叉驗證 4 7 1 建立自定義評分函數 4 7 2 使用交叉驗證迭代器 4 8 超參數調優 4 8 1 超參數調優概述 4 8 2 超參數調優實踐 4 9 小結 課後習題 第5章 單模型學習演算法 5 1 概述 5 1 1 分類模型和回歸模型 5 1 2 機器學習的步驟和要素 5 2 線性回歸和邏輯回歸 5 2 1 從線性回歸到邏輯回歸 5 2 2 線性回歸實踐 5 2 3 Sigmoid函數 5 2 4 推廣至多元場景 5 2 5 邏輯回歸實踐 5 2 6 演算法小結 進階A 交叉熵損失函數和平方差損失函數 5 3 樸素貝葉斯分類 5 3 1 樸素貝葉斯分類演算法 5 3 2 樸素貝葉斯實踐 5 3 3 演算法小結 5 4 最近鄰演算法 5 4 1 k近鄰演算法的概念及原理 5 4 2 k值的選取及特徵歸一化的重要性 5 4 3 最近鄰演算法實踐 5 4 4 演算法小結 進階B kd樹 B 1 kd樹的構建 B 2 kd樹的搜索 B 3 kd樹的不足 5 5 支持向量機 5 5 1 支持向量機基礎 5 5 2 軟間隔 5 5 3 核函數 5 5 4 支持向量機實踐 5 5 5 演算法小結 進階C 對偶問題 C 1 拉格朗日乘子法 C 2 支持向量機優化 進階D 軟間隔情況下的化問題及其求解 5 6 決策樹 5 6 1 資訊理論知識 5 6 2 決策樹基礎 5 6 3 決策樹實踐 5 6 4 演算法小結 5 7 聚類 5 7 1 K均值聚類 5 7 2 小批量KMeans 5 7 3 Affinity Propagation聚類演算法 5 7 4 層次聚類 5 7 5 DBSCAN 5 7 6 演算法小結 5 8 本章小結 課後習題 第6章 集成學習演算法 6 1 集成學習能帶來什麼 6 1 1 集成學習的基本步驟 6 1 2 集成學習中的偏差與方差 6 2 Bagging元學習器 6 3 隨機森林 6 3 1 隨機森林演算法 6 3 2 極度隨機化樹 6 3 3 隨機森林實踐 6 3 4 演算法小結 6 4 Boosting演算法 6 5 AdaBoost演算法 6 5 1 AdaBoost實踐 6 5 2 演算法小結 進階E AdaBoost演算法偽代碼 6 6 GBDT演算法 6 6 1 分類和回歸 6 6 2 GBDT實踐 6 7 基於直方圖的梯度提升 6 7 1 用法 6 7 2 直方圖梯度提升模型實踐 6 8 堆疊泛化 6 9 概率校準 6 9 1 校準曲線 6 9 2 校準分類器 6 10 本章小結 課後習題 第7章 數據可視化 7 1 可視化的定義及作用 7 2 可視化的原則 7 3 常用的可視化分析技術與工具 7 4 Matp 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |