內容簡介
本書以Spark 3 x和Scala 2 x為主線,全面介紹了Spark及其生態體系中常用大數據項目的安裝和使用。全書共10章,分別講解了Scala語言基礎、Spark基礎知識、Spark部署、Spark RDD、Spark SQL、HBase、Kafka、Spark Streaming、Structured Streaming和Spark MLlib,並在最後完整開發了一個在線教育學生學習情況分析系統,幫助大家鞏固前面所學的內容。 本書附有配套視頻、教學PPT、教學設計、測試題等資源,同時,為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。 本書可以作為高等教育本、專科院校數據科學與大數據技術及相關專業的教材,並適合大數據開發初學者、大數據分析與挖掘的從業者閱讀。目錄
第1章 Scala語言基礎