Hive入門與大數據分析實戰 遲殿委 9787302634218 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$566
商品編號: 9787302634218
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202306*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Hive入門與大數據分析實戰
ISBN:9787302634218
出版社:清華大學
著編譯者:遲殿委
叢書名:大數據技術叢書
頁數:214
所在地:中國大陸 *此為代購商品
書號:1522695
可大量預訂,請先連絡。

內容簡介

Hive是基於Hadoop的一個數據倉庫工具,用來進行數據的提取、轉換、載入,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規模數據的機制。Hive能將結構化的數據文件映射為一張資料庫表,並能提供SQL查詢分析功能,將SQL語句轉換成MapReduce任務來執行,從而實現對數據進行分析的目的。本書配套示例源碼、PPT課件、教學大綱。 本書共分11章,內容包括數據倉庫與Hive、Hive部署與基本操作、Hive語法基礎、Hive數據定義、Hive數據操作、Hive查詢、Hive函數、Hive數據壓縮、Hive調優、基於Hive的網站流量分析項目實戰、旅遊酒店評價大數據分析項目實戰。最後的兩個項目實戰(均包括SQL和Java編程兩種解決方法)幫助讀者提高Hive大數據分析的綜合實戰能力。 本書可作為Hive數據倉庫初學者的入門書,也可作為Hive大數據分析與大數據應用開發工程師的指導手冊,還可作為高等院校或者高職高專計算機技術、人工智能、大數據技術及相關專業的教材或教學參考書。

作者簡介

遲殿委,南昌大學計算機軟體與理論專業碩士,系統架構設計師。有多年企業軟體研發經驗和豐富的JavaEE、大數據技術培訓經驗,熟練掌握JavaEE與大數據全棧技術框架,擅長JavaEE系統架構設計、大數據分析與挖掘。著有圖書《Hadoop大數據分析技術》 《Hadoop+Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot+Spring Cloud微服務開發》。

目錄

第1章 數據倉庫與Hive
1 1 數據倉庫概述
1 1 1 數據倉庫特徵與重要概念
1 1 2 數據倉庫的數據存儲方式
1 2 Hive數據倉庫簡介
1 3 Hive版本和MapReduce版本的WordCount比較
1 4 Hive和Hadoop的關係
1 5 Hive和關係資料庫的異同
1 6 Hive數據存儲簡介
第2章 Hjve部署與基本操作
2 1 Linux環境的搭建
2 1 1 VirtualBox虛擬機安裝
2 1 2 安裝Linux操作系統
2 1 3 SSH工具與使用
2 1 4 Linux統一設置
2 2 Hadoop偽分散式環境的搭建
2 2 1 安裝本地模式運行的Hadoop
2 2 2 Hadtoop偽分散式環境的準備
2 2 3 Hadtoop偽分散式的安裝
2 3 Hadoop完全分散式環境的搭建
2 3 1 Hadoop完全分散式集群的搭建
2 3 2 ZooKeeper高可靠集群的搭建
2 3 3 Hadoop高可靠集群的搭建
2 4 Hive的安裝與配置
2 4 1 Hive的安裝與啟動
2 4 2 基本的SQL操作命令
2 5 Hive的一些命令
2 5 1 顯示Hive的幫助
2 5 2 顯示Hive某個命令的幫助
2 5 3 變數與屬性
2 5 4 指定SQL語句或文件
2 5 5 顯示表頭
2 6 Hive元資料庫
2 6 1 Derby
2 6 2 MySQL
2 7 MySQL的安裝
2 8 配置MySQL保存Hive元數據
2 9 HiveServer2與Beeline配置
第3章 Hive語法基礎
3 1 數據類型列表
3 2 集合類型
3 2 1 array測試
3 2 2 map測試
3 2 3 struct測試
3 3 數據類型轉換
3 4 運算符
3 5 Hive表存儲格式
3 6 Hive的其他操作命令
3 7 Hive分析Tomcat日誌案例
第4章 Hive數據定義
4 1 資料庫的增刪改查
4 1 1 在默認位置創建資料庫
4 1 2 指定

目錄

創建資料庫
4 1 3 顯示當前使用的資料庫
4 1 4 刪除資料庫
4 2 創建內部表
4 3 使用關鍵字external創建外部表
4 3 1 指定現有

目錄


4 3 2 先創建表,再指定

目錄


4 3 3 顯示某個表或某個分區的信息
4 4 創建分桶表
4 5 分區表
4 5 1 創建和顯示分區表
4 5 2 增加、刪除和修改分區
4 6 顯示某張表的詳細信息
4 7 指定輸入輸出都是SequenceFile類型
4 8 關於視圖
4 8 1 使用視圖降低查詢的複雜度
4 8 2 查看視圖的信息
4 8 3 刪除視圖
第5章 Hive數據操作
5 1 向表中裝載數據
5 2 通過Insert向表中插入數據
5 3 動態分區插入數據
5 4 創建表並插入數據
5 5 導出數據
第6章 Hive查詢
6 1 SelectFrom語句
6 2 Select基本查詢
6 3 Where語句
6 4 GroupBy語句
6 5 Join語句
6 6 排序
6 6 1 Order By
6 6 2 Sort By
6 6 3 Distrilbute By
6 6 4 Cluster By
6 7 抽樣查詢
第7章 Hive函數
7 1 查看系統內置函數
7 2 常用內置函數
7 3 Hive的其他函數
7 3 1 準備數據
7 3 2 其他函數的使用
7 3 3 顯示某個函數的幫助信息
7 4 自定義函數
7 4 1 Hive自定義UDF的過程
7 4 2 HiveUDTF函數
第8章 Hive數據壓縮
8 1 數據壓縮格式
8 2 數據壓縮配置
8 2 1 Snappy壓縮方式配置
8 2 2 MapReduce支持的壓縮編碼
8 2 3 MapReduce壓縮參數配置
8 3 開啟Map端和Reduce端的輸出壓縮
8 4 常用Hive表存儲格式比較
8 5 存儲與壓縮相結合
第9章 Hive調優
9 1 Hadoop計算框架特性
9 2 Hive優化的常用手段
9 3 Hive優化要點
9 3 1 全排序
9 3 2 怎樣做笛卡兒積
9 3 3 怎樣寫exist/in子句
9 3 4 怎樣決定Reducer個數
9 3 5 合併MapReduce操作
9 3 6 Bucket與Sampling
9 3 7 Partition
9 3 8 Join
9 3 9 數據傾斜
9 3 10 合併小文件
9 3 11 Group By
第10章 基於Hive的網站流量分析項目實戰
10 1 項目需求及分析
10 1 1 數據集及數據說明
10 1 2 功能需求
10 2 利用Java實現數據清洗
10 2 1 數據上傳到HDFS
10 2 2 http log數據清洗
10 2 3 phone txt數據清洗
10 3 利用MySQL實現數據清洗
10 3 1 http log數據清洗
10 3 2 phone txt數據清洗
10 4 數據分析的實現
10 4 1 創建Hive庫和表
10 4 2 使用SQL進行數據分析
第11章 旅遊酒店評價大數據分析項目實戰
11 1 項目介紹
11 2 項目需求及分析
11 2 1 數據集及數據說明
11 2 2 功能需求
11 3 利用Java實現數據清洗
11 3 1 本地Hadoop運行環境搭建
11 3 2 數據上傳到HDFS
11 3 3 Hadoop數據清洗
11 4 利用MySQL實現數據清洗
10 4 1 hotelbasic csv數據清洗
10 4 2 hoteldata csv數據清洗
11 5 數據分析的實現
11 5 1 構
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理