*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Hive大數據存儲與處理 ISBN:9787115637963 出版社:人民郵電 著編譯者:何煌 張良均 頁數:231 所在地:中國大陸 *此為代購商品 書號:1626069 可大量預訂,請先連絡。 內容簡介 本書以廣電大數據案例為主線,系統介紹數據倉庫Hive存儲和初步處理方法的相關知識。本書條理清楚、重點突出,內容循序漸進、由淺入深。本書共8章,包括廣電大數據用戶畫像需求分析、部署開發環境、廣電用戶數據存儲、廣電用戶基本數據簡單查詢、廣電用戶賬單與訂單數據查詢進階、廣電用戶收視行為數據查詢優化、廣電用戶數據清洗及數據導出,以及廣電用戶數據存儲與處理的程序開發。本書大部分章包含實訓和課後習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。 本書可以作為高等院校數據科學或大數據相關專業的教材,也可以作為大數據愛好者的自學用書。目錄 第1章 廣電大數據用戶畫像需求分析任務1 1 需求分析與架構 1 1 1 業務需求分析 1 1 2 大數據存儲技術架構 任務1 2 認識Hive 1 2 1 Hive簡介 1 2 2 Hive的架構 1 2 3 Hive設計特性 小結 課後習題 第2章 部署開發環境 任務2 1 安裝部署Hadoop集群 2 1 1 VMware虛擬機安裝和網路設置 2 1 2 部署CentOS 2 1 3 Hadoop集群部署前準備 2 1 4 Hadoop集群部署 任務2 2 安裝部署Hive 2 2 1 安裝配置MySQL 2 2 2 安裝配置Hive 任務2 3 使用HiveCLI 2 3 1 啟動HiveCLI 2 3 2 在Hive中執行BashShell和Hadoopdfs命令 2 3 3 在Shell中執行Hive查詢 小結 課後習題 第3章 廣電用戶數據存儲 任務3 1 創建業務數據表 3 1 1 操作Hive資料庫 3 1 2 了解Hive數據類型 3 1 3 創建與管理Hive表 3 1 4 任務實現 任務3 2 將數據導入Hive表中 3 2 1 裝載數據至Hive表中 3 2 2 任務實現 小結 實訓 創建輪船乘客表並導入數據至表中 課後習題 第4章 廣電用戶基本數據簡單查詢 任務4 1 查詢廣電用戶的用戶編號及開戶時間 4 1 1 SELECT語句 4 1 2 任務實現 任務4 2 查詢指定用戶狀態的用戶基本數據 4 2 1 使用WHERE關鍵字添加查詢條件 4 2 2 使用WHERE關鍵字添加常見查詢條件 4 2 3 任務實現 任務4 3 統計用戶基本數據表中品牌名稱的種類數 4 3 1 使用DISTINCT關鍵字去重查詢 4 3 2 使用聚合函數 4 3 3 任務實現 任務4 4 統計不同用戶等級名稱的記錄數 4 4 1 設置列別名 4 4 2 任務實現 任務4 5 統計不同用戶狀態的記錄數 4 5 1 使用GROUPBY關鍵字分組查詢 4 5 2 任務實現 任務4 6 統計指定用戶數量範圍的用戶等級 4 6 1 使用HAVING關鍵字對分組結果進行篩選 4 6 2 任務實現 任務4 7 統計用戶數最多的3種用戶狀態 4 7 1 使用LIMIT關鍵字設置查詢結果展示 4 7 2 使用排序關鍵字對查詢結果排序 4 7 3 任務實現 任務4 8 查詢用戶發生狀態變更的時間及開戶時間 4 8 1 使用正則表達式查詢數據 4 8 2 任務實現 小結 實訓 查詢電商貨品訂單數據 課後習題 第5章 廣電用戶賬單與訂單數據查詢進階 任務5 1 統計訂單的消費類型 5 1 1 介紹Hive內置函數 5 1 2 使用條件函數 5 1 3 使用類型轉換函數 5 1 4 任務實現 任務5 2 統計用戶每年消費應付總額 5 2 1 使用字元函數 5 2 2 任務實現 任務5 3 統計用戶每月消費應付總額 5 3 1 使用日期函數 5 3 2 任務實現 任務5 4 統計用戶每月實際賬單金額 5 4 1 使用數學函數 5 4 2 任務實現 任務5 5 查詢用戶寬頻訂單的地址數據 5 5 1 使用JOIN語句 5 5 2 介紹UNIONALL關鍵字 5 5 3 任務實現 任務5 6 抽樣統計用戶訂購產品情況 5 6 1 使用桶表抽樣查詢 5 6 2 任務實現 小結 實訓 實訓1 查詢員工數據 實訓2 查詢學生數據 課後習題 第6章 廣電用戶收視行為數據查詢優化 任務6 1 使用視圖統計不同節目的用戶觀看人數 6 1 1 創建視圖 6 1 2 查看與刪除視圖 6 1 3 任務實現 任務6 2 優化統計直播頻道數 6 2 1 配置Fetch抓取 6 2 2 合理設置map和reduce任務數 6 2 3 配置并行執行 6 2 4 任務實現 任務6 3 使用子查詢統計節目類型為直播的頻道Top 6 3 1 使用子查詢優化查詢語句 6 3 2 優化配置GROUPBY語句 6 3 3 使用GROUPBY代替COUNT(DISTINCT)去重統計 6 3 4 優化配置LIMIT語句 6 3 5 任務實現 小結 實訓 實訓1 統計某城市各線路公交車的刷卡次數 實訓2 統計某百貨商場會員總消費金額Top 課後習題 第7章 廣電用戶數據清洗及數據導出 任務7 1 清洗無效用戶數據 7 1 1 探索無效用戶數據 7 1 2 刪除無效用戶數據 任務7 2 清洗無效收視行為數據 7 2 1 探索無效收視行為數據 7 2 2 刪除無效收視行為數據 任務7 3 清洗無效賬單和訂單數據 7 3 1 探索無效賬單數據 7 3 2 探索無效訂單數據 7 3 3 刪除無效賬單和無效訂單數據 任務7 4 導出處理結果至Linux本地和HDFS 7 4 1 使用INSERTOVERWRITE語句將數據導出至文件系統 7 4 2 保存處理結果至Linux本地和HDFS 小結 實訓 實訓1 刪除無效房價數據 實訓2 刪除惡意好評手機數據並保存結果至Linux本地 課後習題 第8章 廣電用戶數據存儲與處理的程序開發 任務8 1 配置Hive遠程服務 任務8 2 搭建Hive遠程連接環境 8 2 1 創建IDEA開發項目 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |