內容簡介
本書基於Spark 3 3 1框架展開,系統介紹Spark生態系統各組件的操作,以及相應的大數據分析方法。本書各章節均提供豐富的示例及其詳細的操作步驟,並配套示例源碼、PPT課件和教學大綱。 本書共分11章,內容包括Scala編程基礎、Spark框架全生態體驗、Spark RDD、Spark SQL、Kafka、Spark Streaming、Spark ML、Spark GraphX、Redis等技術框架和應用,並通過廣告點擊實時大數據分析和電影影評大數據分析兩個綜合項目進行實戰提升。 本書適合Spark框架初學者,既可以作為大數據分析技術、大數據應用開發工程師的查詢手冊,也可以作為高等院校或高職高專計算機技術、軟體工程、數據科學與大數據科學、智能科學與技術、人工智能等專業大數據課程的教材。作者簡介
遲殿委,南昌大學計算機軟體與理論專業碩士,系統架構設計師。有多年企業軟體研發經驗和豐富的JavaEE、大數據技術培訓經驗,熟練掌握JavaEE與大數據全棧技術框架,擅長JavaEE系統架構設計、大數據分析與挖掘。著有圖書《Hadoop大數據分析技術》 《Hadoop+Spark大數據分析實戰》《Spring Boot企業級開發實戰(視頻教學版)》《深入淺出Java編程》《Spring Boot+Spring Cloud微服務開發》。目錄
第1章 Spark開發之Scala編程基礎