*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202308*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Hadoop生態系統及開發 ISBN:9787560669212 出版社:西安電子科技大學 著編譯者:深圳市訊方技術股份有限公司 頁數:248 所在地:中國大陸 *此為代購商品 書號:1586736 可大量預訂,請先連絡。 內容簡介 本書主要圍繞Hadoop及其生態系統中的各種工具展開講解,重點介紹大數據分析處理的整體流程,剖析每個環節中所使用的不同組件的技術原理和特點。本書內容共分為七個模塊:模塊一為大數據基礎概述,主要講述大數據的概念、來源、應用場景、大數據時代的機遇和挑戰等相關內容;模塊二至模塊六以Hadoop生態系統為基礎,系統地講解了分散式文件系統HDFS、分散式計算框架MapReduce、分散式資源管理器YARN、分散式NoSQL資料庫HBase、分散式數據倉庫Hive、數據採集系統Flume和分散式發布訂閱消息系統Kafka,每一個模塊均附有大量的實訓內容,操作指導步驟詳細,以方便讀者掌握相關知識;模塊七為大數據日誌分析綜合項目案例,通過案例將前面模塊所學的內容融會貫通,以方便讀者掌握大數據開發的核心流程。 本書由深圳市訊方技術股份有限公司與重慶機電職業技術大學共同編寫,並以新時代中國特色社會主義思想為思政面,每個模塊均融入思政元素,內容豐富、概念清晰,可作為大數據相關專業的教材,也可作為大數據領域技術人員及編程愛好者的參考用書。目錄 模塊一 大數據基礎概述1 1 大數據的概念和價值 1 2 大數據的來源 1 3 大數據的應用場景 1 4 大數據時代的機遇和挑戰 1 5 Hadoop及其生態系統簡介 1 6 大數據行業的人才需求狀況 知識鞏固 模塊二 Hadoop分散式文件系統HDFS 2 1 HDFS概述及基本概念 2 1 1 HDFS概述 2 1 2 HDFS的基本概念 2 2 HDFS的系統架構與適用場景 2 2 1 HDFS的系統架構 2 2 2 HDFS的適用場景 2 3 HDFS的操作方式 2 3 1 常用Shell命令 2 3 2 HDFS的數據寫入流程 2 3 3 HDFS的數據讀取流程 2 4 HDFS的關鍵特性 2 4 1 HDFS的架構設計特性 2 4 2 HDFS的高可用性 2 4 3 元數據持久化 2 4 4 HDFS的聯邦存儲機制 2 4 5 HDFS的數據副本機制 2 4 6 HDFS的數據存儲策略 2 4 7 HDFS的數據完整性保障 2 4 8 HDFS的其他關鍵特性 技能實訓 實訓2 1 基礎實訓環境準備 實訓2 2 HDFS的安裝部署與配置 實訓2 3 HDFS的讀寫API操作 知識鞏固 模塊三 分散式計算框架MapReduce和分散式資源管理器YARN 3 1 MapReduce和YARN概述 3 1 1 MapReduce概述 3 1 2 YARN概述 3 2 MapReduce和YARN的工作過程與架構 3 2 1 MapReduce的基本工作過程 3 2 2 Shuffle過程 3 2 3 YARN的組件架構 3 2 4 MapReduce on YARN任務調度流程 3 2 5 YARN RM的HA方案 3 3 YARN的資源管理和任務調度 3 3 1 資源管理及分配模型 3 3 2 調度器的介紹 3 3 3 Capacity調度器的特點與管理 3 3 4 Fair調度器的特點與管理 3 3 5 Capacity調度器與Fair調度器的對比與選型 技能實訓 實訓3 1 YARN集群的部署 實訓3 2 單詞計數(WordCount)程序的編寫 知識鞏固 模塊四 分散式NoSQL資料庫HBase 4 1 HBase概述 4 1 1 HBase簡介 4 1 2 HBase與RDB的對比 4 1 3 HBase的應用場景 4 1 4 行存儲與列存儲 4 1 5 Key-Value存儲模型 4 2 HBase的架構 4 2 1 HBase架構介紹 4 2 2 Master 4 2 3 RegionServer 4 2 4 Region 4 2 5 ColumnFamily 4 2 6 各個組件之間的邏輯關係 4 3 HBase的關鍵流程 4 3 1 寫流程 4 3 2 讀流程 技能實訓 實訓4 1 HBase的安裝與配置 實訓4 2 HBase命令行之Shell操作 實訓4 3 HBase的API操作 知識鞏固 模塊五 分散式數據倉庫Hive 5 1 Hive概述 5 1 1 數據倉庫的概念及特點 5 1 2 Hive的概念與HiveQL簡介 5 1 3 Hive的應用場景 5 1 4 Hive與傳統數據倉庫比較 5 1 5 Hive的優缺點 5 2 Hive的架構原理 5 2 1 Hive的架構 5 2 2 Hive的存儲模型與數據模型 5 2 3 Hive的存儲格式 5 3 Hive的基本操作 5 4 HiveQL的應用 5 4 1 數據定義語言(DDL)講解 5 4 2 數據操縱語言(DML)講解 5 4 3 數據查詢語言(DQL)講解 技能實訓 實訓5 1 Hive的安裝與部署 實訓5 2 數據定義操作的具體實現 實訓5 3 數據操縱操作的具體實現 實訓5 4 查詢操作的具體實現 知識鞏固 模塊六 Hadoop其他大數據生態組件 6 1 數據採集系統Flume 6 1 1 Flume簡介及其架構 6 1 2 Flume的關鍵特性 6 2 分散式發布訂閱消息系統Kafka 6 2 1 Kafka簡介 6 2 2 Kafka的架構與功能 6 2 3 Kafka的常用命令 技能實訓 實訓6 1 Flume的安裝與部署 實訓6 2 用Flume採集數據到HDFS 實訓6 3 Kafka集群部署 實訓6 4 發布訂閱消息系統Kafka的具體實現 知識鞏固 模塊七 大數據日誌分析綜合項目案例 7 1 項目準備 7 2 項目實施 7 3 項目總結 知識鞏固 附錄1 搭建虛擬機環境 附錄2 大數據常用管理腳本 參考文獻 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |