Spark編程基礎 (Python版) (第2版) 林子雨 9787115644039 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:人民郵電
NT$413
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202408*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Spark編程基礎 (Python版) (第2版)
ISBN:9787115644039
出版社:人民郵電
著編譯者:林子雨
叢書名:大數據創新人才培養系列
頁數:271
所在地:中國大陸 *此為代購商品
書號:1672038
可大量預訂,請先連絡。

內容簡介

本書以Python作為開發Spark應用程序的編程語言,系統介紹了Spark編程的基礎知識。全書共9章,內容包括大數據技術概述、Spark的設計與運行原理、大數據實驗環境搭建、Spark環境搭建和使用方法、RDD編程、Spark SQL、Spark Streaming、Structured Streaming和Spark MLlib等。本書安排了入門級的編程實踐內容,以助讀者更好地學習和掌握Spark編程方法。本書免費提供全套在線教學資源,包括PPT課件、習題答案、源代碼、數據集、微課視頻、上機實驗指南等。 本書可以作為高等院校計算機、軟體工程、數據科學與大數據技術等專業的進階級大數據課程教材,用於Spark編程實踐教學,也可以供相關技術人員參考。

目錄

第1章 大數據技術概述
1 1 大數據概念與關鍵技術
1 1 1 大數據概念
1 1 2 大數據關鍵技術
1 2 代表性大數據技術
1 2 1 Hadoop
1 2 2 Spark
1 2 3 Flink
1 2 4 Beam
1 3 編程語言的選擇
1 4 在線資源
1 5 本章小結
1 6 習題
第2章 Spark的設計與運行原理
2 1 概述
2 2 Spark生態系統
2 3 Spark運行架構
2 3 1 基本概念
2 3 2 架構設計方法
2 3 3 Spark運行的基本流程
2 3 4 RDD的設計與運行原理
2 4 Spark部署方式
2 5 本章小結
2 6 習題
第3章 大數據實驗環境搭建
3 1 Linux操作系統的安裝
3 1 1 下載安裝文件
3 1 2 Linux操作系統的安裝方式
3 1 3 虛擬機和Linux操作系統的安裝
3 2 Hadoop的安裝
3 2 1 Hadoop簡介
3 2 2 安裝Hadoop前的準備工作
3 2 3 Hadoop的3種安裝模式
3 2 4 下載Hadoop安裝文件
3 2 5 單機模式配置
3 2 6 偽分散式模式配置
3 2 7 分散式模式配置
3 3 MySQL的安裝
3 3 1 執行安裝命令
3 3 2 啟動MySQL服務
3 3 3 進入MySQL Shell界面
3 3 4 解決MySQL出現的中文亂碼問題
3 4 Kafka的安裝
3 4 1 Kafka簡介
3 4 2 Kafka的安裝和使用
3 5 Anaconda的安裝和使用方法
3 6 本章小結
實驗1 Linux、Hadoop和MySQL的安裝與使用
第4章 Spark環境搭建和使用方法
4 1 安裝Spark(Local模式)
4 1 1 基礎環境
4 1 2 下載安裝文件
4 1 3 配置相關文件
4 1 4 驗證Spark是否安裝成功
4 2 在PySpark中運行代碼
4 2 1 pyspark命令
4 2 2 啟動PySpark
4 3 使用spark-submit命令提交運行程序
4 4 Spark集群環境搭建(Standalone模式)
4 4 1 集群概況
4 4 2 搭建Hadoop集群
4 4 3 安裝Anaconda
4 4 4 在集群中安裝Spark
4 4 5 配置環境變數
4 4 6 Spark的配置
4 4 7 啟動Spark集群
4 4 8 關閉Spark集群
4 5 在集群上運行Spark應用程序
4 5 1 啟動Spark集群
4 5 2 提交運行程序
4 6 Spark on YARN模式
4 6 1 概述
4 6 2 Spark on YARN模式的部署
4 6 3 採用YARN模式運行PySpark
4 6 4 通過spark-submit命令提交程序到YARN集群
4 6 5 Spark on YARN的兩種部署模式
4 7 安裝PySpark類庫
4 7 1 類庫與框架的區別
4 7 2 PySpark類庫的安裝
4 8 開發Spark獨立應用程序
4 8 1 編寫程序
4 8 2 通過spark-submit運行程序
4 9 PyCharm的安裝和使用
4 9 1 安裝PyCharm
4 9 2 使用PyCharm開發Spark程序
4 10 本章小結
4 11 習題
實驗2 Spark的安裝和使用
第5章 RDD編程
5 1 RDD編程基礎
5 1 1 RDD創建
5 1 2 RDD操作
5 1 3 持久化
5 1 4 分區
5 1 5 綜合實例
5 2 鍵值對RDD
5 2 1 鍵值對RDD的創建
5 2 2 常用的鍵值對轉換操作
5 2 3 綜合實例
5 3 數據讀寫
5 3 1 本地文件系統的數據讀寫
5 3 2 分散式文件系統HDFS的數據讀寫
5 3 3 讀寫MySQL資料庫
5 4 綜合實例
5 4 1 求TOP值
5 4 2 文件排序
5 4 3 二次排序
5 5 本章小結
5 6 習題
實驗3 RDD編程初級實踐
第6章 Spark SQL
6 1 Spark SQL簡介
6 1 1 從Shark說起
6 1 2 Spark SQL架構
6 1 3 為什麼推出Spark SQL
6 1 4 Spark SQL的特點
6 1 5 Spark SQL簡單編程實例
6 2 結構化數據DataFrame
6 2 1 DataFrame概述
6 2 2 DataFrame的優點
6 3 DataFrame的創建和保存
6 3 1 Parquet
6 3 2 JSON
6 3 3 CSV
6 3 4 文本文件
6 3 5 序列集合
6 4 DataFrame的基本操作
6 4 1 DSL語法風格
6 4 2 SQL語法風格
6 5 從RDD轉換得到DataFrame
6 5 1 利用反射機制推斷RDD模式
6 5 2 使用編程方式定義RDD模式
6 6 使用Spark SQL讀寫資料庫
6 6 1 準備工作
6 6 2 讀取MySQL資料庫中的數據
6 6 3 向MySQL資料庫寫入數據
6 7 PySpark和pandas的整合
6 7 1 PySpark和pandas進行整合的可行性
6 7 2 pandas數據結構
6 7 3 實例1:兩種DataFrame之間的相互轉換
6 7 4 實例2:使用自定義聚合函數
6 8 綜合實例
6 9 本章小結
6 10 習題
實驗4 Spark SQL編程初級實踐
第7章 Spark Streaming
7 1 流計算概述
7 1 1 靜態數據和流數據
7 1 2 批量計算和實時計算
7 1 3 什麼是流計算
7 1 4 流計算框架
7 1 5 流計算處理流程
7 2 Spark Streaming概
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理