Spark大數據分析與實戰 (第2版) 黑馬程序員 9787302683131 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$369
商品編號: 9787302683131
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202502*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Spark大數據分析與實戰 (第2版)
ISBN:9787302683131
出版社:清華大學
著編譯者:黑馬程序員
頁數:289
所在地:中國大陸 *此為代購商品
書號:1721020
可大量預訂,請先連絡。

內容簡介

本書以Spark 3 x和Scala 2 x為主線,全面介紹了Spark及其生態體系中常用大數據項目的安裝和使用。全書共10章,分別講解了Scala語言基礎、Spark基礎知識、Spark部署、Spark RDD、Spark SQL、HBase、Kafka、Spark Streaming、Structured Streaming和Spark MLlib,並在最後完整開發了一個在線教育學生學習情況分析系統,幫助大家鞏固前面所學的內容。 本書附有配套視頻、教學PPT、教學設計、測試題等資源,同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。 本書可以作為高等教育本、專科院校數據科學與大數據技術及相關專業的教材,並適合大數據開發初學者、大數據分析與挖掘的從業者閱讀。

目錄

第1章 Scala語言基礎
1 1 Scala概述
1 1 1 初識Scala
1 1 2 Scala的安裝
1 1 3 在IntelliJ IDEA中安裝Scala插件
1 1 4 Scala初體驗
1 2 Scala的基礎語法
1 2 1 變數
1 2 2 常量
1 2 3 數據類型
1 2 4 運算符
1 2 5 控制結構語句
1 2 6 方法和函數
1 3 Scala數據結構
1 3 1 數組
1 3 2 元組
1 3 3 集合
1 4 Scala面向對象
1 4 1 類和對象
1 4 2 單例對象
1 4 3 繼承
1 4 4 特質
1 5 本章小結
1 6 課後習題
第2章 Spark基礎
2 1 初識Spark
2 1 1 Spark概述
2 1 2 Spark的特點
2 1 3 Spark應用場景
2 1 4 Spark與MapReduce的區別
2 2 Spark基本架構及運行流程
2 2 1 基本概念
2 2 2 Spark基本架構
2 2 3 Spark運行流程
2 3 Spark的部署模式
2 4 部署Spark
2 4 1 基於Local模式部署Spark
2 4 2 基於Standalone模式部署Spark
2 4 3 基於High Availability模式部署Spark
2 4 4 基於Spark on YARN模式部署Spark
2 5 Spark初體驗
2 6 Spark Shell
2 6 1 Spark Shell命令
2 6 2 讀取HDFS文件實現詞頻統計
2 7 案例——開發Spark程序
2 7 1 環境準備
2 7 2 基於本地模式開發Spark程序
2 7 3 基於集群模式開發Spark程序
2 8 本章小結
2 9 課後習題
第3章 Spark RDD彈性分散式數據集
3 1 RDD簡介
3 2 RDD的創建
3 2 1 基於文件創建RDD
3 2 2 基於數據集合創建RDD
3 3 RDD的處理過程
3 3 1 轉換運算元
3 3 2 行動運算元
3 4 RDD的分區
3 5 RDD的依賴關係
3 6 RDD機制
3 6 1 持久化機制
3 6 2 容錯機制
3 7 Spark的任務調度
3 7 1 DAG的概念
3 7 2 RDD在Spark中的運行流程
3 8 本章小結
3 9 課後習題
第4章 Spark SQL結構化數據處理模塊
4 1 Spark SQL的基礎知識
4 1 1 Spark SQL的簡介
4 1 2 Spark SQL架構
4 2 DataFrame的基礎知識
4 2 1 DataFrame簡介
4 2 2 DataFrame的創建
4 2 3 DataFrame的常用操作
4 2 4 DataFrame的函數操作
4 3 RDD轉換為DataFrame
4 3 1 反射機制推斷Schema
4 3 2 編程方式定義SchemaDataset的基礎知識
4 4 1 Dataset簡介
4 4 2 Dataset的創建
4 5 Spark SQL操作數據源
4 5 1 Spark SQL操作MySQL
4 5 2 Spark SQL操作Hive
4 6 本章小結
4 7 課後習題
第5章 HBase分散式資料庫
5 1 HBase的基礎知識
5 1 1 HBase的簡介
5 1 2 HBase的數據模型
5 2 深入學習HBase原理
5 2 1 HBase架構
5 2 2 物理存儲
5 2 3 HBase讀寫數據流程
5 3 搭建HBase高可用集群
5 4 HBase的基本操作
5 4 1 HBase的Shell操作
5 4 2 HBase的Java API操作
5 5 HBase集成Hive
5 6 本章小結
5 7 課後習題
第6章 Kafka分散式發布訂閱消息系統
6 1 消息隊列簡介
6 2 Kafka簡介
6 3 Kafka工作原理
6 3 1 Kafka的基本架構
6 3 2 Kafka工作流程
6 4 搭建Kafka集群
6 5 Kafka的基本操作
6 5 1 Kafka的Shell操作
6 5 2 Kafka的Scala API操作
6 6 Kafka Streams
6 6 1 Kafka Streams概述
6 6 2 Kafka Streams實現單詞計數功能
6 7 本章小結
6 8 課後習題
第7章 Spark Streaming實時計算框架
7 1 實時計算概述
7 2 Spark Streaming的概述
7 2 1 Spark Streaming簡介
7 2 2 Spark Streaming的工作原理
7 3 Spark Streaming的DStream
7 4 Spark Streaming的編程模型
7 5 Spark Streaming的API操作
7 5 1 輸入操作
7 5 2 轉換操作
7 5 3 輸出操作
7 5 4 窗口操作
7 5 5 案例——電商網站實時熱門品類統計
7 6 Spark Streaming整合Kafka
7 7 本章小結
7 8 課後習題
第8章 Structured Streaming流計算引擎
8 1 Spark Streaming的不足
8 2 Structured Streaming概述
8 2 1 Structured Streaming簡介
8 2 2 Structured Streaming編程模型
8 3 Structured Streaming的API操作
8 3 1 輸入操作
8 3 2 轉換操作
8 3 3 輸出操作
8 4 時間和窗口操作
8 4 1 時間的分類
8 4 2 窗口操作
8 5 案例——物聯網設備數據分析
8 5 1 準備數據
8 5 2 分析數據
8 6 本章小結
8 7 課後習題
第9章 Spark MLlib機器學習庫
9 1 初識機器學習
9 1 1 什麼是機器學習
9 1 2 機器學習的應用
9 2 Spark MLlib概述
9 2 1 Spark MLlib簡介
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理