*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202408*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:數據清洗 (第2版) ISBN:9787302670292 出版社:清華大學 著編譯者:黑馬程序員 叢書名:大數據技術與應用叢書 頁數:307 所在地:中國大陸 *此為代購商品 書號:1681168 可大量預訂,請先連絡。 內容簡介 本書以Kettle 9 2為基礎,全面介紹使用Kettle實現ETL的相關操作。全書共8章,分別講解數據清洗和ETL的概念,Kettle的安裝和使用,如何使用Kettle實現數據抽取、數據清洗、數據轉換和數據載入,並在最後綜合運用上述知識,構建一個電影租賃商店數據倉庫,以使讀者加深對Kettle和ETL的理解與掌握。 本書附有配套視頻、教學PPT、教學設計、測試題等資源,同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。 本書可以作為高等院校數據科學與大數據技術及相關專業的教材,也適合大數據開發初學者、ETL工程師以及數倉開發的從業者閱讀。目錄 第1章 數據清洗概述1 1 數據清洗的背景 1 1 1 數據質量概述 1 1 2 數據質量的評價指標 1 1 3 數據質量問題的分類 1 2 數據清洗的定義 1 3 數據清洗基本流程 1 4 數據清洗策略 1 5 數據清洗常用的方法 1 6 數據清洗面臨的挑戰 1 7 本章小結 1 8 課後習題 第2章 初識ETL 2 1 ETL的定義 2 2 ETL的體繫結構 2 3 ETL關鍵步驟 2 3 1 抽取 2 3 2 轉換 2 3 3 載入 2 4 常見的ETL工具 2 5 本章小結 2 6 課後習題 第3章 Kettle 3 1 初識Kettle 3 1 1 Kettle簡介 3 1 2 Kettle的特點 3 2 Kettle的安裝與啟動 3 3 Kettle的轉換和作業 3 3 1 轉換 3 3 2 作業 3 4 Kettle的基本操作 3 4 1 轉換管理 3 4 2 作業管理 3 4 3 資料庫連接 3 5 本章小結 3 6 課後習題 第4章 數據抽取 4 1 從文件中抽取數據 4 1 1 從CSV文件中抽取數據 4 1 2 從TSV文件中抽取數據 4 1 3 從JSON文件中抽取數據 4 1 4 從XML文件中抽取數據 4 1 5 從HDFS中抽取數據 4 2 從資料庫中抽取數據 4 2 1 從關係資料庫中抽取數據 4 2 2 從非關係資料庫中抽取數據 4 3 從Hive中抽取數據 4 4 從HTML頁面中抽取數據 4 5 本章小結 4 6 課後習題 第5章 數據清洗 5 1 重複值處理 5 2 缺失值處理 5 2 1 缺失值處理策略 5 2 2 刪除缺失值 5 2 3 填補缺失值 5 3 異常值處理 5 3 1 刪除異常值 5 3 2 替換異常值 5 4 本章小結 5 5 課後習題 第6章 數據轉換 6 1 數據規範化處理 6 1 1 數據規範化處理概述 6 1 2 數據規範化處理過程 6 2 多數據源合併 6 2 1 多數據源合併方法 6 2 2 多數據源合併過程 6 3 數據粒度轉換 6 4 數據的商務規則計算 6 5 本章小結 6 6 課後習題 第7章 數據載入 7 1 將數據載入到文本文件 7 2 將數據載入到資料庫 7 2 1 將數據載入到關係資料庫 7 2 2 將數據載入到非關係資料庫 7 3 將數據載入到Hive 7 4 本章小結 7 5 課後習題 第8章 綜合案例——構建電影租賃商店數據倉庫 8 1 案例概述 8 1 1 案例背景介紹 8 1 2 資料庫簡介 8 1 3 數據倉庫簡介 8 2 環境準備 8 3 案例實現 8 3 1 向維度表dim_date載入數據 8 3 2 向維度表dim_time載入數據 8 3 3 向維度表dim_staff載入數據 8 3 4 向維度表dim_customer載入數據 8 3 5 向維度表dim_store載入數據 8 3 6 向維度表dim_actor載入數據 8 3 7 向維度表dim_film載入數據 8 3 8 向橋接表dimjilm_actor_bridge載入數據 8 3 9 向事實表fact_rental載入數據 8 3 10 定期向數據倉庫sakila_dwh載入數據 8 4 本章小結 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |