*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202408*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Hadoop大數據處理技術基礎與實踐 (微課版) (第3版) ISBN:9787115638861 出版社:人民郵電 著編譯者:安俊秀 頁數:244 所在地:中國大陸 *此為代購商品 書號:1672039 可大量預訂,請先連絡。 內容簡介 本書共11章,從Hadoop概述開始,介紹Hadoop的安裝、配置與管理,並對Hadoop的生態體系架構進行介紹,包括HDFS技術、YARN技術、MapReduce技術、Hadoop I/O操作、海量資料庫技術HBase、ZooKeeper技術、分散式數據倉庫技術Hive,以及Hadoop與RDBMS數據遷移工具Sqoop,最後對大數據實時處理技術進行介紹,旨在讓讀者了解當前其他的大數據處理技術。本書還包括豐富的實踐操作,實現理論與實踐的有機結合。 本書除介紹Hadoop的理論外,還介紹如何使用各組件,但因為只介紹基礎的使用方法,沒有涉及底層的高級內容,所以本書只起引導作用。本書旨在讓讀者了解Hadoop並能夠使用Hadoop的基本功能,並不是學習Hadoop的完整手冊。 本書適合作為高等院校和職業院校大數據、物聯網、雲計算及其他計算機相關專業的教材,也可供雲計算與大數據技術相關專業的培訓班使用。目錄 第1章 Hadoop概述1 1 Hadoop簡介 1 2 Hadoop體系架構 1 2 1 Hadoop基礎架構 1 2 2 Hadoop生態系統 1 3 Hadoop與分散式開發 1 4 Hadoop行業應用案例分析 1 4 1 Hadoop在門戶網站中的應用 1 4 2 Hadoop在搜索引擎中的應用 1 4 3 Hadoop在電商平台中的應用 習題 第2章 Hadoop的安裝、配置與管理 2 1 實驗準備 2 2 配置一個單節點環境 2 2 1 運行一個虛擬環境CentOS 2 2 2 配置網路 2 2 3 創建新的用戶組和用戶 2 2 4 上傳文件到CentOS並配置Java和Hadoop環境 2 2 5 修改Hadoop3 2配置文件 2 2 6 修改CentOS主機名 2 2 7 綁定hostname與IP地址 2 2 8 關閉防火牆 2 3 節點之間的免密碼登錄 2 3 1 什麼是SSH 2 3 2 複製虛擬機節點 2 3 3 配置SSH免密碼登錄 2 4 Hadoop的啟動和測試 2 4 1 格式化文件系統 2 4 2 啟動HDFS 2 4 3 啟動YARN 2 4 4 啟動JobHistoryServer 2 4 5 集群驗證 2 4 6 需要了解的默認配置 2 5 動態管理節點 2 5 1 動態增加和刪除DataNode 2 5 2 動態修改TaskTracker 習題 第3章 HDFS技術 3 1 HDFS的特點 3 2 HDFS架構 3 2 1 數據塊 3 2 2 NameNode與DataNode 3 2 3 輔助NameNode 3 2 4 安全模式與負載均衡 3 2 5 垃圾回收 3 3 HDFSShell命令 3 3 1 文件處理命令 3 3 2 互動式命令 3 4 HDFS中JavaAPI的使用 3 4 1 上傳文件 3 4 2 新建文件 3 4 3 查看文件詳細信息 3 4 4 下載文件 3 5 RPC通信 3 5 1 反射機制 3 5 2 代理模式與動態代理 3 5 3 HadoopRPC機制與源碼分析 習題 第4章 YARN技術 4 1 YARN概述 4 1 1 YARN產生背景——MRv1的局限性 4 1 2 YARN的通信協議 4 2 YARN基本框架 4 3 YARN資源調度器 4 4 YARN的工作流程 4 5 YARN的實戰案例 習題 第5章 MapReduce技術 5 1 什麼是MapReduce 5 2 MapReduce編程模型 5 2 1 MapReduce模型簡介 5 2 2 MapReduce模型分類 5 2 3 MapReduce編程實例——WordCount 5 3 MapReduce數據流 5 3 1 分片並格式化原始數據(InputFormat) 5 3 2 Map過程 5 3 3 Shuffle過程 5 3 4 Reduce過程 5 3 5 按指定格式寫入文件(OutputFormat) 5 4 MapReduce任務流程 5 5 MapReduce的Streaming和Pipe 5 5 1 HadoopStreaming 5 5 2 HadoopPipe 5 6 MapReduce性能調優 5 7 MapReduce實戰 5 7 1 快速入門 5 7 2 簡單使用Eclipse插件 習題 第6章 HadoopI/O操作 6 1 HDFS數據完整性 6 1 1 校驗和 6 1 2 運行後台進程來檢測數據塊 6 2 基於文件的數據結構 6 2 1 SequenceFile的存儲 6 2 2 MapFile的存儲 6 2 3 SequenceFile轉換為MapFile 6 3 壓縮 6 3 1 認識壓縮 6 3 2 Codec 6 3 3 本地庫 6 3 4 如何選擇壓縮格式 6 4 序列化 6 4 1 認識序列化 6 4 2 Writable介面 6 4 3 WritableComparable介面 6 4 4 HadoopWritable基本類型 6 4 5 自定義Writable類型 習題 第7章 海量資料庫技術HBase 7 1 初識HBase 7 2 HBase表視圖 7 2 1 概念視圖 7 2 2 物理視圖 7 3 HBase物理存儲模型 7 4 安裝HBase 7 4 1 HBase單節點安裝 7 4 2 HBase偽分散式安裝 7 4 3 HBase完全分散式安裝 7 5 HBaseShell 7 5 1 HBaseShell的命令 7 5 2 general操作 7 5 3 DDL操作 7 5 4 DML操作 7 6 HBase操作實踐 習題 第8章 ZooKeeper技術 8 1 分散式協調技術及其實現者 8 2 ZooKeeper基本架構 8 3 ZooKeeper數據模型 8 3 1 Znode 8 3 2 ZooKeeper中的時間 8 3 3 Znode屬性 8 3 4 watch觸發器 8 4 ZooKeeper集群安裝 8 5 ZooKeeper的主要Shell操作 8 6 典型應用場景 8 6 1 數據發布與訂閱 8 6 2 統一命名服務 8 6 3 分散式通知協調 習題 第9章 分散式數據倉庫技術Hive 9 1 Hive出現的原因 9 2 Hive服務的組成 9 3 Hive的安裝 9 3 1 Hive基本安裝 9 3 2 MySQL的安裝 9 3 3 Hive的配置 9 4 HiveShell 9 5 HQL的概念和使用 9 5 1 認識HQL 9 5 2 Hive管理數據方式 9 5 3 Hive表的DDL操作 9 5 4 Hive表的DML操作 9 6 使用Hive實現聊天數據分析案例 習題 第10章 Hadoop與RDBMS數據遷移工具Sqoop 10 1 Sqoop簡介及基本安裝 10 2 Sqoop的配置 10 3 Sqoop的相關功能 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |