Spark大數據分析與實戰-Python+PySpark (微課版) 9787121472770 李新輝 馮霞

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:電子工業
NT$381
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*數量非實際在台庫存
*完成訂單後正常情形下約兩周可抵台

*本賣場提供之資訊僅供參考,以到貨標的為實際資訊。
印行年月:202402*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Spark大數據分析與實戰-Python+PySpark (微課版)
ISBN:9787121472770
出版社:電子工業
著編譯者:李新輝 馮霞
頁數:300
所在地:中國大陸 *此為代購商品
書號:1619499
可大量預訂,請先連絡。

【台灣高等教育出版社簡體書】 Spark大數據分析與實戰-Python+PySpark (微課版) 787121472770 李新輝 馮霞

內容簡介

Spark是業界主流的大數據計算框架。本書通過一系列大數據應用案例和實踐項目貫穿始終,使用Python詳細闡述了Spark大數據環境的搭建、Spark RDD離線數據計算、Spark SQL離線數據處理、Spark Streaming實時數據計算等一系列常見的大數據處理問題,並在此基礎上對Spark的核心概念及技術原理進行了詳細分析,最後以兩個綜合案例分別展示了Spark離線數據處理和實時數據處理的具體應用與部署。 本書踐行「做中學」的設計理念,內容編排符合學習與認知規律,從簡單細小案例入手,輔以大量配圖對學習過程中涉及的枯燥數據、抽象概念和複雜原理進行圖示化說明,語言淺顯易懂,技術體系清晰,邏輯銜接合理。在本書最後兩個綜合案例中,分別從需求分析、技術準備、數據清洗、需求實現、數據可視化等幾個關鍵環節展開敘述,便於讀者對Spark大數據項目的整體開發流程有一個比較清晰的認識。 本書既可作為高校大數據、人工智慧等相關專業課程的教材,也可作為從事大數據分析、大數據運維工作的技術人員和廣大技術愛好者的參考書。

目錄

第1章 Spark大數據平台與環境搭建
1 1 引言
1 2 Spark大數據平台介紹
1 2 1 Spark是什麼
1 2 2 Spark與大數據的應用場景
1 2 3 Spark編程環境(PySpark)
1 2 4 Spark應用程序原理
1 3 Spark大數據環境搭建
1 3 1 Linux作系統安裝和配置
1 3 2 Hadoop偽分佈集群環境搭建
1 3 3 Spark單機運行環境搭建
1 4 Python核心語法概覽
1 5 單元訓練
第2章 Spark RDD離線數據計算
2 1 引言
2 2 RDD基本原理
2 3 RDD編程模型
2 4 Spark RDD常用作
2 4 1 RDD的創建
2 4 2 RDD的轉換作
2 4 3 RDD的行動作
2 5 Spark RDD數據計算實例
2 5 1 詞頻統計案例
2 5 2 基本TopN問題案例
2 5 3 用戶消費數據處理案例
2 6 Spark文件的讀/寫
2 6 1 文本文件的讀/寫
2 6 2 SequenceFile文件的讀/寫
2 7 單元訓練
第3章 Spark SQL離線數據處理
3 1 引言
3 2 DataFrame基本原理
3 3 Spark SQL常用作
3 3 1 DataFrame的基本創建
3 3 2 DataFrame的查看
3 3 3 DataFrame的數據作(DSL)
3 3 4 DataFrame的數據作(SQL)
3 4 Spark SQL數據處理實例
3 4 1 詞頻統計案例
3 4 2 人口信息統計案例
3 4 3 電影評分數據分析案例
3 5 Spark SQL訪問資料庫
3 5 1 在Linux作系統上安裝MySQL
3 5 2 DataFrame寫入MySQL
3 5 3 從MySQL中創建DataFrame
3 6 DataFrame創建和存
3 6 1 創建DataFrame
3 6 2 存DataFrame
3 7 Spark的數據類型轉換
3 8 單元訓練
第4章 Spark Streaming實時數據計算
4 1 引言
4 2 Spark Streaming基本原理
4 3 Spark Streaming詞頻統計
4 3 1 Netcat網路工具測試
4 3 2 DStream詞頻統計
4 4 DStream數據轉換作
4 4 1 DStream無狀態轉換作
4 4 2 DStream基於狀態更新的轉換
4 4 3 DStream基於滑動窗口的轉換
4 5 DStream輸出作
4 6 DStream數據源讀取
4 6 1 讀取文件數據流
4 6 2 讀取Kafka數據流
4 7 單元訓練
第5章 Spark編程進
5 1 引言
5 2 搭建PySpark開發環境
5 2 1 PySpark互動式編程環境
5 2 2 Jupyter Notebook編程環境
5 2 3 PyCharm集成開發環境
5 3 理解RDD
5 3 1 RDD基本概念
5 3 2 RDD的分區
5 3 3 RDD的依賴關係
5 3 4 RDD的計算調度
5 4 RDD緩存機制
5 5 廣播變數和累加器
5 5 1 廣播變數
5 5 2 累加器
5 6 Spark生態和應用架構
5 6 1 Spark生態架構
5 6 2 Spark應用架構
5 7 Spark集群和應用署
5 7 1 Spark偽分佈集群的搭建
5 7 2 Spark應用署模式
5 7 3 Spark應用署實例
5 8 單元訓練
第6章 Spark大數據分析項目實例
6 1 引言
6 2 CentOS7+JDK8虛擬機安裝
6 3 Hadoop+Spark分散式集群環境
6 3 1 Hadoop+Spark Standalone分散式集群環境搭建
6 3 2 Hadoop+Spark on YARN分散式集群環境搭建
6 4 Spark離線數據處理實例
6 4 1 需求分析
6 4 2 準備工作
6 4 3 美妝商品訂單數據分析
6 4 4 美妝商品訂單數據可視化
6 5 Spark實時數據處理實例
6 5 1 需求分析
6 5 2 準備工作
6 5 3 通話記錄生產者模擬
6 5 4 消息接收者測試
6 5 5 Spark Streaming通話記錄消息處理
6 6 Spark數據分析案例署

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理