Python爬蟲實戰進階 李科均 9787302627661 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$566
商品編號: 9787302627661
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202305*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Python爬蟲實戰進階
ISBN:9787302627661
出版社:清華大學
著編譯者:李科均
頁數:332
所在地:中國大陸 *此為代購商品
書號:1509538
可大量預訂,請先連絡。

內容簡介

本書主要滿足網路爬蟲從業者提升技術能力的需求。本書共9章,涉及經典爬蟲框架Scrapy的架構、非同步爬蟲的原理及其實現、非同步自動化瀏覽器控制庫pyppeteer的使用、當下流行的反爬蟲原理及其處理方案、基於常用通信中間件的分散式爬蟲框架開發、Python常用的編碼和加密的應用、針對前端深入的JavaScript分析策略和安全策略、網路搜索引擎的原理和技術實現,並在最後一章創建了一個垂直領域的搜索引擎系統。 本書面向網路爬蟲開發的初、中級開發人員,以及對網路爬蟲有一定基礎的興趣愛好者。

目錄

第1章 Scrapy框架
1 1 關於Scrapy
1 1 1 Serapy簡介
1 1 2 Scrapy安裝
1 2 Scrapy基礎
1 2 1 Scrapy測試流程
1 2 2 Scrapy開發流程
1 2 3 Scrapy框架架構
1 2 4 Request對象和Response對象
1 2 5 HTML頁面解析
1 2 6 HTML頁面泛解析
1 3 爬蟲組件
1 3 1 基礎爬蟲
1 3 2 通用爬蟲
1 4 中間件組件
1 4 1 爬蟲中間件
1 4 2 下載中間件
1 4 3 隨機UserAgent中間件
1 4 4 Selenium中間件
1 4 5 pyppeteer中間件
1 5 數據管道組件
1 5 1 自定義Pipeline
1 5 2 文件下載Pipeline
1 5 3 文件下載案例
1 6 數據導出器組件
1 6 1 內置數據導出器
1 6 2 自定義數據導出器
1 7 分散式Scrapy
1 7 1 分散式架構
1 7 2 分散式通信隊列
1 7 3 分散式爬蟲
1 7 4 分散式調度
1 7 5 分散式去重
1 7 6 自定義去重組件
1 7 7 基本開發流程
1 8 Scrapy參考手冊
1 8 1 常用命令
1 8 2 常用配置項
1 9 案例:使用Scrapy獲取噹噹網商品信息
1 9 1 項目需求
1 9 2 項目分析
1 9 3 編碼實現
1 9 4 容器化部署
第2章 非同步爬蟲
2 1 非同步I/O與協程
2 1 1 迭代器與生成器
2 1 2 yield from關鍵字
2 1 3 Python協程原理
2 2 asyncio非同步框架
2 2 1 創建可等待對象
2 2 2 運行asyncio程序
2 2 3 asyncio結果回調
2 2 4 asyncio併發和多線程
2 3 非同步請求和文件操作
2 3 1 aiohttp非同步請求庫
2 3 2 requests非同步方案
2 3 3 aiofiles非同步文件操作
2 4 非同步資料庫
2 4 1 MySQL非同步讀寫
2 4 2 MongoDB非同步讀寫
2 4 3 Redis非同步讀寫
2 5 案例:全流程非同步爬蟲的運用
2 5 1 案例需求
2 5 2 案例分析
2 5 3 編碼實現
第3章 pyppeteer
3 1 pyppeteer基礎
3 1 1 pyppeteer簡介
3 1 2 pyppeteer環境安裝
3 2 pyppeteer的常用內部方法
3 2 1 瀏覽器啟動器
3 2 2 頁面常用操作
3 2 3 頁面Cookie處理
3 2 4 頁面節點選擇器
3 2 5 鍵盤和滑鼠操作
3 2 6 內嵌框處理
3 2 7 JavaScript操作
3 2 8 Request和Response
3 3 pyppeteer常用操作
3 3 1 啟動項參數設置
3 3 2 識別特徵處理
3 3 3 配置代理及認證
3 3 4 攔截請求和響應
3 4 案例:pyppeteer動態代理的切換
第4章 反爬蟲
4 1 設備指紋
4 1 1 Canvas指紋
4 1 2 WebGL指紋
4 1 3 Font指紋
4 1 4 AudioContext指紋
4 2 滑動驗證
4 2 1 滑動距離識別
4 2 2 軌跡生成演算法
4 2 3 滑動驗證示例
4 3 字體反爬蟲
4 3 1 字體反爬蟲原理
4 3 2 通用解決方案
4 3 3 字體反爬蟲示例
4 4 CSS樣式反爬蟲
4 4 1 元素排序覆蓋
4 4 2 雪碧圖拼湊
4 4 3 選擇器插入
4 5 動態渲染
4 5 1 Ajax動態載入信息
4 5 2 requests-html渲染
4 5 3 替Splash渲染方案
4 6 圖片驗證碼
4 6 1 驗證碼生成及驗證原理
4 6 2 Tesseract 4環境部署
4 6 3 二值化、去噪點和識別
4 6 4 Tesseract 4樣本訓練
4 7 IP限制
4 7 1 代理技術原理及發展現狀
4 7 2 全新分散式家庭代理
4 7 3 零成本純凈測試IP
第5章 分散式爬蟲系統的設計
5 1 消息系統的消息傳遞模式
5 1 1 發布-訂閱模式
5 1 2 點對點模式
5 1 3 Redis發布-訂閱框架
5 2 基於RabbitMQ中間件的設計
5 2 1 RabbitMQ基礎
5 2 2 Docker部署RabbitMQ
5 2 3 RabbitMQ可視化管理
5 2 4 Python中使用RabbitMQ
5 3 基於Kafka中間件的設計
5 3 1 Kafka基礎
5 3 2 docker部署Kafka集群
5 3 3 Kafka可視化管理
5 3 4 Python中使用Kafka
5 4 基於Celery分散式框架的設計
5 4 1 Celery基礎
5 4 2 Celery的使用
5 4 3 Celery可視化管理
5 4 4 路由任務與定時任務
第6章 編碼及加密
6 1 編碼及轉換
6 1 1 編碼與亂碼原理
6 1 2 URL編碼轉換
6 1 3 Bytes對象
6 1 4 Base64編碼
6 2 加密與解密
6 2 1 概述
6 2 2 DES與3DES
6 2 3 AES加密
6 2 4 RSA加密及簽名
6 2 5 散列函數
第7章 JavaScript安全分析
7 1 JavaSeript分析基礎
7 1 1 瀏覽器開發者工具
7 1 2 斷點及動態調試
7 1 3 加密庫CryptoJS
7 1 4 Python中運行JavaScript
7 2 JavaScript入口定位
7 2 1 全局搜索
7 2 2 事件記錄器
7
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理