內容簡介
本書介紹了Hadoop生態系統架構功能與原理;分散式文件系統HDF-SHDFS;MapReduce編程模型及應用開發;YARN原理及配置;Hadoop偽分散式環境的搭建與配置測試;Hadoop完整分散式的集群配置搭建;Zookeeper分散式協作框架;HDFSHA原理功能與配置測試;ResourceManagerHA原理與配置;通過實際案例介紹了網站用戶行為分析、網站後台日誌分析和二次排序;介紹數據倉庫Hive的原理及安裝部署、Hive的基本操作及實戰操作;大數據協作框架Sqoop、Flume、Oozie及Hue的原理、配置、使用及其在企業項目中使用的架構;HBase的概念、HBase內部管理(region分裂、分配、合併)、HBase架構設計及表的存儲設計;HBaseshell基本使用;HBaseJavaAPI使用及HBase應用案例。 本書可以作為計算機科學與技術、軟體工程、數據科學與大數據技術等相關專業的本科生和研究生的教材,也可作為信息技術領域的專業人士的參考書。目錄
第1章 Hadoop概述目錄
的配置分析