內容簡介
本書主要滿足網路爬蟲從業者提升技術能力的需求。本書共9章,涉及經典爬蟲框架Scrapy的架構、非同步爬蟲的原理及其實現、非同步自動化瀏覽器控制庫pyppeteer的使用、當下流行的反爬蟲原理及其處理方案、基於常用通信中間件的分散式爬蟲框架開發、Python常用的編碼和加密的應用、針對前端深入的JavaScript分析策略和安全策略、網路搜索引擎的原理和技術實現,並在最後一章創建了一個垂直領域的搜索引擎系統。 本書面向網路爬蟲開發的初、中級開發人員,以及對網路爬蟲有一定基礎的興趣愛好者。目錄
第1章 Scrapy框架