內容簡介
本書介紹了Python3網路爬蟲的常見技術。首先介紹了網頁的基礎知識,然後介紹了urllib、Requests請求庫以及XPath、BeautifulSoup等解析庫,接著介紹了selenium對動態網站的爬取和Scrapy爬蟲框架,最後介紹了Linux基礎,便於讀者自主部署編寫好的爬蟲腳本。本書所有代碼和相關素材可以到GitHub下載獲取,地址為https://github com/sfvsfv/Crawer。 本書主要面向對網路爬蟲感興趣的初學者。作者簡介
楊涵文,網名「川川」,現致力於全棧開發領域,在大數據分析與挖掘、機器學習、人工智能、網站開發等領域實戰經驗豐富。CSDN內容合伙人、阿里雲博客專家,全網20萬粉絲博主,熱衷於技術研究,樂於分享。目錄
前言目錄