內容簡介
本書通過大量實例介紹大數據平台技術,分4篇。大數據存儲篇包括第1~3章,內容包括大數據技術概述、數據採集和大數據、大數據框架的安裝和配置;大數據管理篇包括第4~7章,內容包括HDFS、Hadoop分散式計算模型、分散式協調服務ZooKeeper、Hadoop的集群資源管理系統YARN;大數據分析篇包括第8~10章,內容包括資料庫MySQL和數據倉庫Hive、NoSQL資料庫HBase、基於內存的分散式計算框架Spark;大數據應用篇包括第11、12章,內容包括數據可視化、大數據應用綜合案例。 本書可作為高等學校數據科學與大數據技術、計算機科學與技術、人工智能等理工類專業大數據平台技術課程的教材,也可供廣大計算機愛好者及軟體開發人員參考。作者簡介
鄭嘯,博士,教授,安徽省教學名師。先後畢業於安徽大學、浙江理工大學、東南大學。現任安徽工業大學教務處處長、安徽省工業互聯網智能應用與安全工程研究中心主任。是2021-2024年教育部產學合作協同育人項目專家組成員、中國軟體行業協會常務理事、中國計算機學會網路與數據通信專委會常務委員、中國通信學會雲計算與大數據應用專業委員會委員。曾任安徽工業大學計算機科學與技術學院院長。在智能計算、控制系統、大數據、雲計算等領域獲安徽省科學技術獎二等獎、三等獎各1項,中國物流與採購聯合會科技進步三等獎1項,冶金科技進步三等獎1項,安徽省自然科學優秀論文二等獎1項、三等獎2項。在高等教育研究領域獲得安徽省教學成果特等獎2項,一等獎1項,三等獎2項。目錄
第1篇 大數據存儲篇目錄
操作命令