內容簡介
本書以Python作為主要工具,著重講解海量數據採集與處理相關內容。力求通過由淺入深、先理論基礎后實踐應用的思路,培養學生應用Python解決實際問題的能力。全書內容分為上、下篇共9章。上篇主要介紹數據採集的基本概念、Python開發環境、數據採集常用的兩種框架Numpy和Pandas的使用;下篇對數據採集原理、爬蟲基礎庫的使用、頁面採集框架的使用、數據的存儲與使用、數據的清洗與預處理,以及綜合實例的應用進行介紹。本書在內容編寫與安排上盡量做到結構合理、邏輯嚴謹,可供信息管理與信息系統、大數據、計算機、人工智能等相關專業的學生使用;亦可供經濟管理類其他專業學生入門參考,用於交叉方向的科學研究。作者簡介
葉堂林,教授,博士生導師,首都經濟貿易大學特大城市經濟社會發展研究院(首都高端智庫)執行院長。省部協同創新中心執行副主任、北京市經濟社會發展政策研究基地首席專家、國家社科基金重大項目首席專家,京津冀藍皮書主編。主要從事京津冀協同發展、都市圈治理、區域協同創新、數字經濟等領域的研究。近年來,主持完成和在研國家社科基金重大項目、國家自然科學基金面上項目、教育部人文社科專項等20餘項,出版專著20餘部,在《經濟學動態》等國內外權威期刊發表學術論文120餘篇。參与國家重大政策起草19項,獲省部級以上領導批示和採納近50項。目錄
上篇 數據採集基礎