Spark大數據技術與應用 賀鑫史宏 9787115630094 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:人民郵電
NT$381
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Spark大數據技術與應用
ISBN:9787115630094
出版社:人民郵電
著編譯者:賀鑫史宏
叢書名:大數據應用人才能力培養新形態系列
頁數:218
所在地:中國大陸 *此為代購商品
書號:1626070
可大量預訂,請先連絡。

內容簡介

本書以初學者的角度詳細介紹Spark架構的核心技術,主要圍繞Spark的架構、Spark的開發語言、Spark模塊的主要功能展開;以IDEA為主要開發工具,CentOS為運行環境,採用「理實一體化」授課模式。本書內容包括Spark導論,Spark環境搭建與使用,Scala語言,Spark彈性分散式數據集,Spark SQL、DataFrame和DataSet,Kafka分散式發布-訂閱消息系統,Spark Streaming實時計算框架,Spark MLlib 機器學習演算法庫,Redis資料庫,綜合案例—Spark電商實時數據處理。通過對本書的學習,讀者可以充分理解常用數據預處理方法的精髓,掌握具體技術細節,並在實踐中提升實際開發能力,為學習大數據技能打下紮實基礎。 本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等相關專業的教材,也可作為相關技術人員的參考書。

目錄

第1章 Spark導論
1 1 認識Spark
1 1 1 Spark的演進路線
1 1 2 Spark的特點
1 1 3 Spark與Hadoop的聯繫
1 2 Spark的生態系統
1 2 1 Spark Core
1 2 2 Spark SQL
1 2 3 Spark Streaming
1 2 4 Spark MLlib
1 2 5 Spark GraphX
1 3 Spark運行模式
1 3 1 Standalone模式
1 3 2 Mesos模式
1 3 3 YARN模式
1 4 Spark架構
1 4 1 Spark架構組成
1 4 2 Spark架構運行流程
1 4 3 Spark架構特點
1 5 Spark應用場景
1 6 本章小結
1 7 習題
第2章 Spark環境搭建與使用
2 1 搭建環境前的準備
2 1 1 Spark的下載
2 1 2 Scala的下載
2 1 3 Spark的前置配置
2 2 Spark集群的部署與操作
2 2 1 Spark集群的部署
2 2 2 Spark集群的啟動與停止
2 3 第一個Spark程序
2 4 Spark Shell的啟動
2 5 本章小結
2 6 習題
第3章 Scala語言
3 1 Scala簡介
3 1 1 什麼是Scala
3 1 2 Scala的特性
3 1 3 Scala的優勢
3 2 Scala的安裝
3 2 1 Windows下安裝Scala編譯器
3 2 2 Linux下安裝Scala編譯器
3 3 Scala基礎
3 3 1 Scala快速入門
3 3 2 在IntelliJ IDEA中創建Scala項目
3 4 Scala的基本語法
3 4 1 聲明變數
3 4 2 定義字元串
3 4 3 數據類型
3 4 4 運算符
3 4 5 塊表達式
3 5 Scala的流程式控制制結構
3 5 1 順序結構
3 5 2 分支結構
3 5 3 循環結構
3 5 4 breakable和break()方法
3 6 Scala的方法與函數
3 6 1 Scala中方法的定義和調用
3 6 2 Scala中函數的定義和調用
3 6 3 Scala中將方法轉換成函數
3 7 Scala面向對象的特性
3 7 1 類和對象
3 7 2 private關鍵字
3 7 3 繼承
3 7 4 單例對象
3 7 5 伴生對象
3 7 6 構造器
3 7 7 特質
3 7 8 抽象類
3 8 Scala的數據結構
3 8 1 數組
3 8 2 元組
3 8 3 集合
3 9 lazy關鍵字
實戰訓練:數組合併去重
3 10 本章小結
3 11 習題
第4章 Spark彈性分散式數據集
4 1 RDD簡介
4 1 1 RDD的產生背景
4 1 2 RDD的特性
4 2 RDD的創建操作
4 2 1 從文件系統中載入數據創建RDD
4 2 2 通過并行集合創建RDD
4 2 3 從父RDD轉換成新的子RDD
4 3 RDD運算元
4 3 1 轉換運算元
4 3 2 動作運算元
4 3 3 RDD常用運算元練習
4 3 4 運算元進階
實戰訓練4-1:WordCount詞頻統計案例
4 4 RDD的分區
4 5 RDD的依賴關係
4 5 1 劃分依賴的背景
4 5 2 劃分依賴的依據
4 5 3 窄依賴
4 5 4 寬依賴
4 5 5 Stage的劃分
4 6 RDD機制
4 6 1 持久化機制
4 6 2 RDD緩存方式
4 6 3 容錯機制Checkpoint
4 7 Spark作業流程
4 7 1 DAG的生成
4 7 2 任務調度流程
4 7 3 提交任務的4個階段
4 8 共享變數
4 8 1 廣播變數
4 8 2 累加器
實戰訓練4-2:通過相關信息計算用戶停留時間
實戰訓練4-3:統計學生信息
4 9 本章小結
4 10 習題
第5章 Spark SQL、DataFrame和DataSet
5 1 Spark SQL簡介
5 1 1 Spark SQL的概念
5 1 2 Spark SQL的特點
5 1 3 Spark SQL的運行架構
5 2 DataFrame基礎知識
5 2 1 DataFrame概念
5 2 2 創建DataFrame對象
5 2 3 DataFrame常用操作
5 3 DataSet基礎知識
5 3 1 DataSet編程
5 3 2 DataSet的DSL風格操作
5 4 將RDD轉為DataFrame的操作
5 4 1 通過反射推斷Schema
5 4 2 DSL風格語法
5 4 3 通過StructType直接指定Schema
5 5 RDD、DataFrame和DataSet的區別
5 5 1 RDD的優缺點
5 5 2 DataFrame的優缺點
5 5 3 DataSet的優缺點
5 5 4 Spark SQL的性能與優化
5 6 通過Spark SQL操作數據源
5 6 1 操作MySQL數據源
5 6 2 操作Hive數據源
實戰訓練5-1:獲取連續活躍用戶的記錄
實戰訓練5-2:計算店鋪銷售額
5 7 本章小結
5 8 習題
第6章 Kafka分散式發布-訂閱消息系統
6 1 Kafka簡介
6 1 1 什麼是Kafka
6 1 2 消息系統簡介
6 1 3 Kafka術語
6 2 Kafka與傳統消息系統的區別
6 2 1 應用場景
6 2 2 架構模型
6 2 3 吞吐量
6 2 4 可用性
6 2 5 集群負載均衡
6 3 Kafka工作原理
6 3 1 Kafka的拓撲結構
6 3 2 分析Kafka工作流程
6 4 Kafka集群的部署與測試
6 4 1 集群部署的基礎環境準備
6 4 2 安裝Kafka
6 4 3 啟動Kafka服務並進行測試
6 5 Kafka
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理