| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202406*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:Scrapy網絡爬蟲開發實戰 ISBN:9787302658580 出版社:清華大學 著編譯者:羅剛 頁數:173 所在地:中國大陸 *此為代購商品 書號:1632268 可大量預訂,請先連絡。 內容簡介 本書介紹如何學習和使用流行的Scrapy框架開髮網絡爬蟲應用,主要內容使用Python開髮網絡爬蟲,識別網頁的編碼,結構化信息的提取,Scrapy爬蟲的示例使用,Scrapy Playwright抓取動態JS網站,將抓取的數據保存到資料庫,部署、調度和運行Scrapy爬蟲等。 本書適合作為高等院校計算機、軟體工程專業本科生、研究生的參考書目,也適用於對Python網路爬蟲領域感興趣的人士參考閱讀。目錄 第1章 網路爬蟲快速入門1 1 各種網路爬蟲 1 1 1 通用爬蟲 1 1 2 定向爬蟲 1 2 網路爬蟲基本技術 1 3 Windows命令行 1 4 上手Scrapy網路爬蟲開發 1 5 本章小結 第2章 Python開發快速入門 2 1 變數 2 2 註釋 2 3 簡單數據類型 2 3 1 數值 2 3 2 字元串 2 3 3 數組 2 4 字面值 2 5 控制流 2 5 1 if語句 2 5 2 循環 2 6 列表 2 7 元組 2 8 集合 2 9 字典 2 10 函數 2 11 模塊 2 12 檢查字元串是否包含子字元串 2 13 面向對象編程 2 14 泛型 2 15 日誌記錄 2 16 資料庫 2 17 本章小結 第3章 使用Python開髮網絡爬蟲 3 1 使用BeautifulSoup實現定向採集 3 2 URL基礎 3 2 1 URI 3 2 2 解析相對地址 3 2 3 DNS解析 3 3 網路爬蟲抓取原理 3 4 爬蟲架構 3 4 1 基本架構 3 4 2 分散式爬蟲架構 3 4 3 垂直爬蟲架構 3 5 下載網頁 3 5 1 HTTP 3 5 2 HTML文檔 3 5 3 使用curl命令下載網路資源 3 5 4 使用wget命令下載網頁 3 5 5 下載靜態網頁 3 5 6 使用Selenium下載動態內容 3 5 7 重試 3 6 下載圖片 3 7 網路爬蟲的遍歷與實現 3 8 robots協議 3 9 連接池 3 10 URL地址查新 3 10 1 Redis資料庫 3 10 2 布隆過濾器 3 11 抓取RSS 3 12 網頁更新 3 13 進度條 3 14 垂直行業抓取 3 15 抓取限制的應對方法 3 15 1 模擬瀏覽器訪問 3 15 2 使用代理IP 3 15 3 抓取需要登錄的網頁 3 16 保存信息 3 16 1 SQLite資料庫 3 16 2 MySQL資料庫 3 16 3 MongoDB資料庫 3 16 4 存入Elasticsearch搜索引擎 3 17 本章小結 第4章 從互聯網提取信息 4 1 識別網頁的編碼 4 1 1 二進位流的編碼 4 1 2 識別編碼的整體流程 4 2 正則表達式 4 3 結構化信息的提取 4 3 1 解析JSON 4 3 2 解析XML 4 3 3 XML介面 4 3 4 lxml處理網頁 4 3 5 使用XPath提取信息 4 3 6 在Chrome瀏覽器中查找Selenium WebDriver的XPath 4 3 7 CSS選擇器 4 3 8 使用Parsel 4 3 9 提取文本 4 3 10 網頁正文提取 4 4 從文件提取信息 4 5 本章小結 第5章 使用Scrapy開發爬蟲 5 1 一個示例爬蟲的演練 5 2 Scrapy Playwright指南:渲染和抓取動態JS網站 5 3 將抓取的數據保存到SQLite資料庫 5 4 將抓取的數據保存到MySQL資料庫 5 5 將抓取的數據保存到Postgres資料庫 5 6 Scrapyd:部署、調度和運行Scrapy爬蟲 5 7 ScrapyCloud託管爬蟲 5 8 Twisted框架 5 9 本章小結 第6章 分散式爬蟲開發 6 1 簡單的Celery任務 6 2 從任務進行分散式抓取 6 3 本章小結 第7章 開髮網絡爬蟲用戶界面 7 1 Tkinter簡介 7 2 網路爬蟲圖形用戶界面 7 3 本章小結 第8章 案例分析 8 1 影視採集器 8 2 暗網爬蟲 8 3 本章小結 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |