Hadoop大數據技術原理與編程 曹潔等著 9787302666790 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
NT$375
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202407*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Hadoop大數據技術原理與編程
ISBN:9787302666790
出版社:清華大學
著編譯者:曹潔等著
頁數:292
所在地:中國大陸 *此為代購商品
書號:1664133
可大量預訂,請先連絡。

內容簡介

本書系統介紹了大數據的相關知識,全書共13章,內容包括Hadoop大數據處理架構、HDFS分散式文件系統、YARN資源管理、MapReduce分散式計算框架、HBase分散式資料庫、流數據採集、典型非關係資料庫的安裝與使用、分散式數據分析工具Pig、Spark大數據處理框架、基於Python的Spark RDD編程、基於Python的Spark SQL結構化數據處理、Hive分散式數據倉庫、典型數據可視化工具的使用。本書對大數據相關技術給出詳細的編程示例,並給出詳細的註解。 本書可作為高等院校計算機、信息管理、軟體工程、人工智慧、數據科學與大數據技術等相關專業的大數據課程教材,也可供相關技術人員參考。

作者簡介

曹潔,博士,畢業於同濟大學電子與信息工程學院計算機軟體與理論專業;主要研究方向是并行分散式處理、雲計算、大數據;主持和參与國家級、省部級項目5項;在《軟體學報》《計算機研究與發展》《通信學報》等國內外核心刊物上發表學術論文12篇;主講「Python語言程序設計」「大數據技術及應用」「雲計算技術」等課程;主編《Python語言程序設計》(微課版),參編《數據挖掘》《Struts2+Hibermate框架技術教程》(第2版)等多部教材。

目錄

第1章 Hadoop大數據處理架構
1 1 大數據的基本概念
1 1 1 大數據時代
1 1 2 大數據定義
1 1 3 大數據的特徵
1 1 4 大數據思維
1 2 大數據計算模式與典型系統
1 2 1 批處理計算模式與典型系統
1 2 2 流式計算模式與典型系統
1 2 3 迭代計算模式與典型系統
1 2 4 圖計算模式與典型系統
1 2 5 內存計算模式與典型系統
1 3 Hadoop發展歷程
1 4 Hadoop優缺點
1 5 Hadoop生態圈
1 6 在VirtualBox上搭建Linux操作系統
1 6 1 創建Master節點
1 6 2 克隆虛擬電腦
1 7 Hadoop安裝前的準備工作
1 7 1 創建hadoop用戶
1 7 2 安裝SSH、配置SSH無密碼登錄
1 7 3 安裝Java環境
1 7 4 Linux操作系統下Scala版本的Eclipse的安裝與配置
1 7 5 Eclipse環境下Java語言程序開發實例
1 8 Hadoop的安裝與配置
1 8 1 下載Hadoop安裝文件
1 8 2 Hadoop單機模式配置
1 8 3 Hadoop偽分散式模式配置
1 8 4 Hadoop分散式模式配置
1 9 習題
第2章 HDFS分散式文件系統
2 1 HDFS基本特徵
2 2 HDFS存儲架構及組件功能
2 2 1 HDFS存儲架構
2 2 2 數據塊
2 2 3 數據節點
2 2 4 名稱節點
2 2 5 第二名稱節點
2 2 6 心跳消息
2 2 7 客戶端
2 3 HDFS讀寫文件流程
2 3 1 HDFS讀文件流程
2 3 2 HDFS寫文件流程
2 4 HDFS的Shell操作
2 4 1 查看命令使用方法
2 4 2 HDFS常用的Shell操作
2 4 3 HDFS管理員命令
2 4 4 HDFS的Java API操作
2 5 案例實戰1:修改文件名
2 5 1 在Eclipse中創建項目
2 5 2 為項目添加需要用到的JAR包
2 5 3 編寫Java語言應用程序
2 5 4 編譯運行程序
2 5 5 應用程序的部署
2 6 案例實戰2:文件讀取、上傳和下載
2 6 1 讀取文件內容
2 6 2 文件上傳和下載
2 7 習題
第3章 YARN資源管理
3 1 YARN概述
3 2 YARN基礎架構
3 2 1 Container
3 2 2 ResourceManager
3 2 3 NodeManager
3 2 4 Applleation Master
3 2 5 Client

第4章 MapReduce分散式計算框架
第5章 HBase分散式資料庫
第6章 流數據採集
第7章 典型非關係資料庫的安裝與使用
第8章 分散式數據分析工具Pig
第9章 Spark大數據處理框架
第10章 基於Python語言的Spark RDD編程
第11章 基於Python語言的Spark SQL結構化數據處理
第12章 Hive分散式數據倉庫
第13章 典型數據可視化工具的使用
參考文獻
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理