內容簡介
Hive是基於Hadoop的一個數據倉庫工具,用來進行數據的提取、轉換、載入,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規模數據的機制。Hive能將結構化的數據文件映射為一張資料庫表,並能提供SQL查詢分析功能,將SQL語句轉換成MapReduce任務來執行,從而實現對數據進行分析的目的。本書配套示例源碼、PPT課件、教學大綱。 本書共分11章,內容包括數據倉庫與Hive、Hive部署與基本操作、Hive語法基礎、Hive數據定義、Hive數據操作、Hive查詢、Hive函數、Hive數據壓縮、Hive調優、基於Hive的網站流量分析項目實戰、旅遊酒店評價大數據分析項目實戰。最後的兩個項目實戰(均包括SQL和Java編程兩種解決方法)幫助讀者提高Hive大數據分析的綜合實戰能力。 本書可作為Hive數據倉庫初學者的入門書,也可作為Hive大數據分析與大數據應用開發工程師的指導手冊,還可作為高等院校或者高職高專計算機技術、人工智能、大數據技術及相關專業的教材或教學參考書。作者簡介
遲殿委,南昌大學計算機軟體與理論專業碩士,系統架構設計師。有多年企業軟體研發經驗和豐富的JavaEE、大數據技術培訓經驗,熟練掌握JavaEE與大數據全棧技術框架,擅長JavaEE系統架構設計、大數據分析與挖掘。著有圖書《Hadoop大數據分析技術》 《Hadoop+Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot+Spring Cloud微服務開發》。目錄
第1章 數據倉庫與Hive目錄
創建資料庫目錄
目錄