*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202408*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Spark編程基礎 (Python版) (第2版) ISBN:9787115644039 出版社:人民郵電 著編譯者:林子雨 叢書名:大數據創新人才培養系列 頁數:271 所在地:中國大陸 *此為代購商品 書號:1672038 可大量預訂,請先連絡。 內容簡介 本書以Python作為開發Spark應用程序的編程語言,系統介紹了Spark編程的基礎知識。全書共9章,內容包括大數據技術概述、Spark的設計與運行原理、大數據實驗環境搭建、Spark環境搭建和使用方法、RDD編程、Spark SQL、Spark Streaming、Structured Streaming和Spark MLlib等。本書安排了入門級的編程實踐內容,以助讀者更好地學習和掌握Spark編程方法。本書免費提供全套在線教學資源,包括PPT課件、習題答案、源代碼、數據集、微課視頻、上機實驗指南等。 本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等專業的進階級大數據課程教材,用於Spark編程實踐教學,也可以供相關技術人員參考。目錄 第1章 大數據技術概述1 1 大數據概念與關鍵技術 1 1 1 大數據概念 1 1 2 大數據關鍵技術 1 2 代表性大數據技術 1 2 1 Hadoop 1 2 2 Spark 1 2 3 Flink 1 2 4 Beam 1 3 編程語言的選擇 1 4 在線資源 1 5 本章小結 1 6 習題 第2章 Spark的設計與運行原理 2 1 概述 2 2 Spark生態系統 2 3 Spark運行架構 2 3 1 基本概念 2 3 2 架構設計方法 2 3 3 Spark運行的基本流程 2 3 4 RDD的設計與運行原理 2 4 Spark部署方式 2 5 本章小結 2 6 習題 第3章 大數據實驗環境搭建 3 1 Linux操作系統的安裝 3 1 1 下載安裝文件 3 1 2 Linux操作系統的安裝方式 3 1 3 虛擬機和Linux操作系統的安裝 3 2 Hadoop的安裝 3 2 1 Hadoop簡介 3 2 2 安裝Hadoop前的準備工作 3 2 3 Hadoop的3種安裝模式 3 2 4 下載Hadoop安裝文件 3 2 5 單機模式配置 3 2 6 偽分散式模式配置 3 2 7 分散式模式配置 3 3 MySQL的安裝 3 3 1 執行安裝命令 3 3 2 啟動MySQL服務 3 3 3 進入MySQL Shell界面 3 3 4 解決MySQL出現的中文亂碼問題 3 4 Kafka的安裝 3 4 1 Kafka簡介 3 4 2 Kafka的安裝和使用 3 5 Anaconda的安裝和使用方法 3 6 本章小結 實驗1 Linux、Hadoop和MySQL的安裝與使用 第4章 Spark環境搭建和使用方法 4 1 安裝Spark(Local模式) 4 1 1 基礎環境 4 1 2 下載安裝文件 4 1 3 配置相關文件 4 1 4 驗證Spark是否安裝成功 4 2 在PySpark中運行代碼 4 2 1 pyspark命令 4 2 2 啟動PySpark 4 3 使用spark-submit命令提交運行程序 4 4 Spark集群環境搭建(Standalone模式) 4 4 1 集群概況 4 4 2 搭建Hadoop集群 4 4 3 安裝Anaconda 4 4 4 在集群中安裝Spark 4 4 5 配置環境變數 4 4 6 Spark的配置 4 4 7 啟動Spark集群 4 4 8 關閉Spark集群 4 5 在集群上運行Spark應用程序 4 5 1 啟動Spark集群 4 5 2 提交運行程序 4 6 Spark on YARN模式 4 6 1 概述 4 6 2 Spark on YARN模式的部署 4 6 3 採用YARN模式運行PySpark 4 6 4 通過spark-submit命令提交程序到YARN集群 4 6 5 Spark on YARN的兩種部署模式 4 7 安裝PySpark類庫 4 7 1 類庫與框架的區別 4 7 2 PySpark類庫的安裝 4 8 開發Spark獨立應用程序 4 8 1 編寫程序 4 8 2 通過spark-submit運行程序 4 9 PyCharm的安裝和使用 4 9 1 安裝PyCharm 4 9 2 使用PyCharm開發Spark程序 4 10 本章小結 4 11 習題 實驗2 Spark的安裝和使用 第5章 RDD編程 5 1 RDD編程基礎 5 1 1 RDD創建 5 1 2 RDD操作 5 1 3 持久化 5 1 4 分區 5 1 5 綜合實例 5 2 鍵值對RDD 5 2 1 鍵值對RDD的創建 5 2 2 常用的鍵值對轉換操作 5 2 3 綜合實例 5 3 數據讀寫 5 3 1 本地文件系統的數據讀寫 5 3 2 分散式文件系統HDFS的數據讀寫 5 3 3 讀寫MySQL資料庫 5 4 綜合實例 5 4 1 求TOP值 5 4 2 文件排序 5 4 3 二次排序 5 5 本章小結 5 6 習題 實驗3 RDD編程初級實踐 第6章 Spark SQL 6 1 Spark SQL簡介 6 1 1 從Shark說起 6 1 2 Spark SQL架構 6 1 3 為什麼推出Spark SQL 6 1 4 Spark SQL的特點 6 1 5 Spark SQL簡單編程實例 6 2 結構化數據DataFrame 6 2 1 DataFrame概述 6 2 2 DataFrame的優點 6 3 DataFrame的創建和保存 6 3 1 Parquet 6 3 2 JSON 6 3 3 CSV 6 3 4 文本文件 6 3 5 序列集合 6 4 DataFrame的基本操作 6 4 1 DSL語法風格 6 4 2 SQL語法風格 6 5 從RDD轉換得到DataFrame 6 5 1 利用反射機制推斷RDD模式 6 5 2 使用編程方式定義RDD模式 6 6 使用Spark SQL讀寫資料庫 6 6 1 準備工作 6 6 2 讀取MySQL資料庫中的數據 6 6 3 向MySQL資料庫寫入數據 6 7 PySpark和pandas的整合 6 7 1 PySpark和pandas進行整合的可行性 6 7 2 pandas數據結構 6 7 3 實例1:兩種DataFrame之間的相互轉換 6 7 4 實例2:使用自定義聚合函數 6 8 綜合實例 6 9 本章小結 6 10 習題 實驗4 Spark SQL編程初級實踐 第7章 Spark Streaming 7 1 流計算概述 7 1 1 靜態數據和流數據 7 1 2 批量計算和實時計算 7 1 3 什麼是流計算 7 1 4 流計算框架 7 1 5 流計算處理流程 7 2 Spark Streaming概 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |