內容簡介
本書從爬蟲項目開發環境搭建開始,詳細講解從數據採集到內容可視化的全過程。本書從7個網站爬蟲項目出發,根據項目需求選取不同的數據採集和處理技術,並有針對性地講解幾種Python網路爬蟲。 本書共8章,前3章是入門篇,第4、5、6章是進階篇,第7、8章是高級篇。涵蓋的內容有Scrapy爬蟲、Requests爬蟲、Selenium模擬瀏覽器、XPath語言、CSS選擇器、CSV存儲、MySQL存儲、JSON讀取、Parsel解析、Flask框架、ECharts可視化等。 本書參考企業項目開發的工作流程,圖文並茂地講解每個操作步驟,並提供運行結果讓讀者檢驗自己的代碼,中間也穿插介紹相關知識點和疑難問題。本書適用於高職高專院校大數據技術專業開展項目化教學和畢業設計指導,也可作為網路爬蟲愛好者的啟蒙資料。目錄
第一篇 網路爬蟲入門篇