*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202307*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Spark原理深入與編程實戰 (微課視頻版) ISBN:9787302628866 出版社:清華大學 著編譯者:辛立偉 張帆 張會娟 叢書名:開發者成長叢書 頁數:770 所在地:中國大陸 *此為代購商品 書號:1557248 可大量預訂,請先連絡。 內容簡介 本書系統講述Apache Spark大數據計算平台的原理,以及如何將Apache Spark應用於大數據的實時流處理、批處理、圖計算等各個場景。通過深入學習原理和對實踐示例、案例的綜合應用,使讀者了解並掌握Apache Spark大數據計算平台的基本原理和技能,接近理論與實踐的距離。 全書共分為13章,主要內容包括Spark架構原理與集群搭建、開發和部署Spark應用程序、Spark核心編程、Spark SQL、Spark SQL高級分析、Spark Streaming流處理、Spark結構化流、Spark結構化流高級處理、Spark圖處理庫Graph Frame、下一代大數據技術(Delta Lake數據湖、leeberg數據湖和Hudi數據湖)、Spark大數據處理綜合案例。本書源碼全部在Apache Spark 3 1 2上調試成功,所有示例和案例均基於Scala語言。 為降低讀者學習大數據技術的門檻,本書除了提供豐富的上機實踐操作和範例程序詳解外,還為購買和使用本書的讀者提供了搭建好的Hadoop、Hive數據倉庫和Spark大數據開發及學習環境。讀者既可參照本書的講解自行搭建Hadoop和Spark環境,也可直接使用作者提供的開發和學習環境,快速開始大數據和Spark、數據湖的學習。 本書適合大數據學習愛好者、想要入門Apache Spark的讀者作為入門和提高的技術參考書,也適合用作高等院校大數據專業相關的學生和老師的教材或教學參考書。作者簡介 辛立偉,一個在IT領域摸爬滾打二十多年的老程序員、技術培訓師、技術作者。橫跨Java、資料庫、大數據開發與分析、人工智慧等多個領域,參与多個IT項目的架構設計與開發。長期堅持撰寫技術博客,曾在多個大學講授Java開發、資料庫和大數據技術課程,曾擔任中國石油大學(青島校區)等多所院校的外聘講師。目錄 第1章 Spark架構原理與集群搭建1 1 Spark簡介 1 2 Spark技術棧 1 2 1 Spark Core 1 2 2 Spark SQL 1 2 3 Spark Streaming和Structured Streaming 1 2 4 Spark MLlib 1 2 5 Spark GraphX 1 2 6 SparkR 1 3 Spark架構原理 1 3 1 Spark集群和資源管理系統 1 3 2 Spark應用程序 1 3 3 SparkDriver和Executor 1 4 Spark程序部署模式 1 5 安裝和配置Spark集群 1 5 1 安裝Spark 1 5 2 了解Spark 目錄 結構1 5 3 配置Spark集群 1 5 4 驗證Spark安裝 1 6 配置Spark歷史伺服器 1 6 1 歷史伺服器配置 1 6 2 啟動Spark歷史伺服器 1 7 使用spark-shell進行互動式分析 1 7 1 運行模式--master 1 7 2 啟動和退出spark-shell 1 7 3 spark-shell常用命令 1 7 4 SparkContext和SparkSession 1 7 5 SparkWeb UI 1 8 使用spark-submit提交Spark應用程序 1 8 1 spark-submit指令的各種參數說明 1 8 2 提交SparkPi程序,計算圓周率π值 1 8 3 將SparkPi程序提交到YARN集群上執行 第 2章 開發和部署Spark應用程序 2 1 使用IntelliJ IDEA開發SparkSBT應用程序 2 1 1 安裝IntelliJ IDEA 2 1 2 配置 IntelliJ IDEA Scala環境 2 1 3 創建 IntelliJ IDEA SBT項目 2 1 4 配置SBT構建文件 2 1 5 準備數據文件 2 1 6 創建Spark應用程序 2 1 7 部署分散式Spark應用程序 2 1 8 遠程調試Spark程序 2 2 使用IntelliJ IDEA開發SparkMaven應用程序 2 2 1 創建IntelliJ IDEA Maven項目 2 2 2 驗證SDK安裝和配置 2 2 3 項目依賴和配置管理 2 2 4 測試Spark程序 2 2 5 項目編譯和打包 2 3 使用Java 開發Spark應用程序 2 3 1 創建一個新的IntelliJ項目 2 3 2 驗證SDK安裝和配置 2 3 3 安裝和配置Maven 2 3 4 創建Spark應用程序 2 3 5 部署Spark應用程序 2 3 6 遠程調試Spark應用程序 2 4 使用Zeppelin進行互動式分析 2 4 1 下載Zeppelin安裝包 2 4 2 安裝和配置Zeppelin 2 4 3 配置Spark解釋器 2 4 4 創建和執行Notebook程序 第3章 Spark核心編程 3 1 理解數據抽象RDD 3 1 1 RDD結構 3 1 2 RDD容錯 3 2 RDD編程模型 3 2 1 單詞計數應用程序 3 2 2 理解SparkSession 3 2 3 理解SparkContext 3 3 創建RDD 3 3 1 將現有的集合併行化以創建RDD 3 3 2 從存儲系統讀取數據集以創建RDD 3 3 3 從已有的RDD轉換得到新的RDD 3 3 4 創建RDD時指定分區數量 第4章 Spark SQL 第5章 Spark SQL(高級) 第6章 Spark Streaming流處理 第7章 Spark結構化流 第8章 Spark結構化流(高級) 第9章 Spark圖處理庫GraphFrame 第10章 Delta Lake數據湖 第11章 Iceberg數據湖 第12章 Hudi數據湖 第13章 Spark大數據處理綜合案例 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |