Hive大數據存儲與處理 何煌 張良均 9787115637963 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:人民郵電
NT$381
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Hive大數據存儲與處理
ISBN:9787115637963
出版社:人民郵電
著編譯者:何煌 張良均
頁數:231
所在地:中國大陸 *此為代購商品
書號:1626069
可大量預訂,請先連絡。

內容簡介

本書以廣電大數據案例為主線,系統介紹數據倉庫Hive存儲和初步處理方法的相關知識。本書條理清楚、重點突出,內容循序漸進、由淺入深。本書共8章,包括廣電大數據用戶畫像需求分析、部署開發環境、廣電用戶數據存儲、廣電用戶基本數據簡單查詢、廣電用戶賬單與訂單數據查詢進階、廣電用戶收視行為數據查詢優化、廣電用戶數據清洗及數據導出,以及廣電用戶數據存儲與處理的程序開發。本書大部分章包含實訓和課後習題,通過練習和操作實踐,幫助讀者鞏固所學的內容。 本書可以作為高等院校數據科學或大數據相關專業的教材,也可以作為大數據愛好者的自學用書。

目錄

第1章 廣電大數據用戶畫像需求分析
任務1 1 需求分析與架構
1 1 1 業務需求分析
1 1 2 大數據存儲技術架構
任務1 2 認識Hive
1 2 1 Hive簡介
1 2 2 Hive的架構
1 2 3 Hive設計特性
小結
課後習題
第2章 部署開發環境
任務2 1 安裝部署Hadoop集群
2 1 1 VMware虛擬機安裝和網路設置
2 1 2 部署CentOS
2 1 3 Hadoop集群部署前準備
2 1 4 Hadoop集群部署
任務2 2 安裝部署Hive
2 2 1 安裝配置MySQL
2 2 2 安裝配置Hive
任務2 3 使用HiveCLI
2 3 1 啟動HiveCLI
2 3 2 在Hive中執行BashShell和Hadoopdfs命令
2 3 3 在Shell中執行Hive查詢
小結
課後習題
第3章 廣電用戶數據存儲
任務3 1 創建業務數據表
3 1 1 操作Hive資料庫
3 1 2 了解Hive數據類型
3 1 3 創建與管理Hive表
3 1 4 任務實現
任務3 2 將數據導入Hive表中
3 2 1 裝載數據至Hive表中
3 2 2 任務實現
小結
實訓 創建輪船乘客表並導入數據至表中
課後習題
第4章 廣電用戶基本數據簡單查詢
任務4 1 查詢廣電用戶的用戶編號及開戶時間
4 1 1 SELECT語句
4 1 2 任務實現
任務4 2 查詢指定用戶狀態的用戶基本數據
4 2 1 使用WHERE關鍵字添加查詢條件
4 2 2 使用WHERE關鍵字添加常見查詢條件
4 2 3 任務實現
任務4 3 統計用戶基本數據表中品牌名稱的種類數
4 3 1 使用DISTINCT關鍵字去重查詢
4 3 2 使用聚合函數
4 3 3 任務實現
任務4 4 統計不同用戶等級名稱的記錄數
4 4 1 設置列別名
4 4 2 任務實現
任務4 5 統計不同用戶狀態的記錄數
4 5 1 使用GROUPBY關鍵字分組查詢
4 5 2 任務實現
任務4 6 統計指定用戶數量範圍的用戶等級
4 6 1 使用HAVING關鍵字對分組結果進行篩選
4 6 2 任務實現
任務4 7 統計用戶數最多的3種用戶狀態
4 7 1 使用LIMIT關鍵字設置查詢結果展示
4 7 2 使用排序關鍵字對查詢結果排序
4 7 3 任務實現
任務4 8 查詢用戶發生狀態變更的時間及開戶時間
4 8 1 使用正則表達式查詢數據
4 8 2 任務實現
小結
實訓 查詢電商貨品訂單數據
課後習題
第5章 廣電用戶賬單與訂單數據查詢進階
任務5 1 統計訂單的消費類型
5 1 1 介紹Hive內置函數
5 1 2 使用條件函數
5 1 3 使用類型轉換函數
5 1 4 任務實現
任務5 2 統計用戶每年消費應付總額
5 2 1 使用字元函數
5 2 2 任務實現
任務5 3 統計用戶每月消費應付總額
5 3 1 使用日期函數
5 3 2 任務實現
任務5 4 統計用戶每月實際賬單金額
5 4 1 使用數學函數
5 4 2 任務實現
任務5 5 查詢用戶寬頻訂單的地址數據
5 5 1 使用JOIN語句
5 5 2 介紹UNIONALL關鍵字
5 5 3 任務實現
任務5 6 抽樣統計用戶訂購產品情況
5 6 1 使用桶表抽樣查詢
5 6 2 任務實現
小結
實訓
實訓1 查詢員工數據
實訓2 查詢學生數據
課後習題
第6章 廣電用戶收視行為數據查詢優化
任務6 1 使用視圖統計不同節目的用戶觀看人數
6 1 1 創建視圖
6 1 2 查看與刪除視圖
6 1 3 任務實現
任務6 2 優化統計直播頻道數
6 2 1 配置Fetch抓取
6 2 2 合理設置map和reduce任務數
6 2 3 配置并行執行
6 2 4 任務實現
任務6 3 使用子查詢統計節目類型為直播的頻道Top
6 3 1 使用子查詢優化查詢語句
6 3 2 優化配置GROUPBY語句
6 3 3 使用GROUPBY代替COUNT(DISTINCT)去重統計
6 3 4 優化配置LIMIT語句
6 3 5 任務實現
小結
實訓
實訓1 統計某城市各線路公交車的刷卡次數
實訓2 統計某百貨商場會員總消費金額Top
課後習題
第7章 廣電用戶數據清洗及數據導出
任務7 1 清洗無效用戶數據
7 1 1 探索無效用戶數據
7 1 2 刪除無效用戶數據
任務7 2 清洗無效收視行為數據
7 2 1 探索無效收視行為數據
7 2 2 刪除無效收視行為數據
任務7 3 清洗無效賬單和訂單數據
7 3 1 探索無效賬單數據
7 3 2 探索無效訂單數據
7 3 3 刪除無效賬單和無效訂單數據
任務7 4 導出處理結果至Linux本地和HDFS
7 4 1 使用INSERTOVERWRITE語句將數據導出至文件系統
7 4 2 保存處理結果至Linux本地和HDFS
小結
實訓
實訓1 刪除無效房價數據
實訓2 刪除惡意好評手機數據並保存結果至Linux本地
課後習題
第8章 廣電用戶數據存儲與處理的程序開發
任務8 1 配置Hive遠程服務
任務8 2 搭建Hive遠程連接環境
8 2 1 創建IDEA開發項目
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理