*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Spark大數據技術與應用 ISBN:9787115630094 出版社:人民郵電 著編譯者:賀鑫史宏 叢書名:大數據應用人才能力培養新形態系列 頁數:218 所在地:中國大陸 *此為代購商品 書號:1626070 可大量預訂,請先連絡。 內容簡介 本書以初學者的角度詳細介紹Spark架構的核心技術,主要圍繞Spark的架構、Spark的開發語言、Spark模塊的主要功能展開;以IDEA為主要開發工具,CentOS為運行環境,採用「理實一體化」授課模式。本書內容包括Spark導論,Spark環境搭建與使用,Scala語言,Spark彈性分散式數據集,Spark SQL、DataFrame和DataSet,Kafka分散式發布-訂閱消息系統,Spark Streaming實時計算框架,Spark MLlib 機器學習演算法庫,Redis資料庫,綜合案例—Spark電商實時數據處理。通過對本書的學習,讀者可以充分理解常用數據預處理方法的精髓,掌握具體技術細節,並在實踐中提升實際開發能力,為學習大數據技能打下紮實基礎。 本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等相關專業的教材,也可作為相關技術人員的參考書。目錄 第1章 Spark導論1 1 認識Spark 1 1 1 Spark的演進路線 1 1 2 Spark的特點 1 1 3 Spark與Hadoop的聯繫 1 2 Spark的生態系統 1 2 1 Spark Core 1 2 2 Spark SQL 1 2 3 Spark Streaming 1 2 4 Spark MLlib 1 2 5 Spark GraphX 1 3 Spark運行模式 1 3 1 Standalone模式 1 3 2 Mesos模式 1 3 3 YARN模式 1 4 Spark架構 1 4 1 Spark架構組成 1 4 2 Spark架構運行流程 1 4 3 Spark架構特點 1 5 Spark應用場景 1 6 本章小結 1 7 習題 第2章 Spark環境搭建與使用 2 1 搭建環境前的準備 2 1 1 Spark的下載 2 1 2 Scala的下載 2 1 3 Spark的前置配置 2 2 Spark集群的部署與操作 2 2 1 Spark集群的部署 2 2 2 Spark集群的啟動與停止 2 3 第一個Spark程序 2 4 Spark Shell的啟動 2 5 本章小結 2 6 習題 第3章 Scala語言 3 1 Scala簡介 3 1 1 什麼是Scala 3 1 2 Scala的特性 3 1 3 Scala的優勢 3 2 Scala的安裝 3 2 1 Windows下安裝Scala編譯器 3 2 2 Linux下安裝Scala編譯器 3 3 Scala基礎 3 3 1 Scala快速入門 3 3 2 在IntelliJ IDEA中創建Scala項目 3 4 Scala的基本語法 3 4 1 聲明變數 3 4 2 定義字元串 3 4 3 數據類型 3 4 4 運算符 3 4 5 塊表達式 3 5 Scala的流程式控制制結構 3 5 1 順序結構 3 5 2 分支結構 3 5 3 循環結構 3 5 4 breakable和break()方法 3 6 Scala的方法與函數 3 6 1 Scala中方法的定義和調用 3 6 2 Scala中函數的定義和調用 3 6 3 Scala中將方法轉換成函數 3 7 Scala面向對象的特性 3 7 1 類和對象 3 7 2 private關鍵字 3 7 3 繼承 3 7 4 單例對象 3 7 5 伴生對象 3 7 6 構造器 3 7 7 特質 3 7 8 抽象類 3 8 Scala的數據結構 3 8 1 數組 3 8 2 元組 3 8 3 集合 3 9 lazy關鍵字 實戰訓練:數組合併去重 3 10 本章小結 3 11 習題 第4章 Spark彈性分散式數據集 4 1 RDD簡介 4 1 1 RDD的產生背景 4 1 2 RDD的特性 4 2 RDD的創建操作 4 2 1 從文件系統中載入數據創建RDD 4 2 2 通過并行集合創建RDD 4 2 3 從父RDD轉換成新的子RDD 4 3 RDD運算元 4 3 1 轉換運算元 4 3 2 動作運算元 4 3 3 RDD常用運算元練習 4 3 4 運算元進階 實戰訓練4-1:WordCount詞頻統計案例 4 4 RDD的分區 4 5 RDD的依賴關係 4 5 1 劃分依賴的背景 4 5 2 劃分依賴的依據 4 5 3 窄依賴 4 5 4 寬依賴 4 5 5 Stage的劃分 4 6 RDD機制 4 6 1 持久化機制 4 6 2 RDD緩存方式 4 6 3 容錯機制Checkpoint 4 7 Spark作業流程 4 7 1 DAG的生成 4 7 2 任務調度流程 4 7 3 提交任務的4個階段 4 8 共享變數 4 8 1 廣播變數 4 8 2 累加器 實戰訓練4-2:通過相關信息計算用戶停留時間 實戰訓練4-3:統計學生信息 4 9 本章小結 4 10 習題 第5章 Spark SQL、DataFrame和DataSet 5 1 Spark SQL簡介 5 1 1 Spark SQL的概念 5 1 2 Spark SQL的特點 5 1 3 Spark SQL的運行架構 5 2 DataFrame基礎知識 5 2 1 DataFrame概念 5 2 2 創建DataFrame對象 5 2 3 DataFrame常用操作 5 3 DataSet基礎知識 5 3 1 DataSet編程 5 3 2 DataSet的DSL風格操作 5 4 將RDD轉為DataFrame的操作 5 4 1 通過反射推斷Schema 5 4 2 DSL風格語法 5 4 3 通過StructType直接指定Schema 5 5 RDD、DataFrame和DataSet的區別 5 5 1 RDD的優缺點 5 5 2 DataFrame的優缺點 5 5 3 DataSet的優缺點 5 5 4 Spark SQL的性能與優化 5 6 通過Spark SQL操作數據源 5 6 1 操作MySQL數據源 5 6 2 操作Hive數據源 實戰訓練5-1:獲取連續活躍用戶的記錄 實戰訓練5-2:計算店鋪銷售額 5 7 本章小結 5 8 習題 第6章 Kafka分散式發布-訂閱消息系統 6 1 Kafka簡介 6 1 1 什麼是Kafka 6 1 2 消息系統簡介 6 1 3 Kafka術語 6 2 Kafka與傳統消息系統的區別 6 2 1 應用場景 6 2 2 架構模型 6 2 3 吞吐量 6 2 4 可用性 6 2 5 集群負載均衡 6 3 Kafka工作原理 6 3 1 Kafka的拓撲結構 6 3 2 分析Kafka工作流程 6 4 Kafka集群的部署與測試 6 4 1 集群部署的基礎環境準備 6 4 2 安裝Kafka 6 4 3 啟動Kafka服務並進行測試 6 5 Kafka 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |