深入解析Python反爬蟲 任傑麟 苟如意 9787111764076 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
NT$630
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202410*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:深入解析Python反爬蟲
ISBN:9787111764076
出版社:機械工業
著編譯者:任傑麟 苟如意
頁數:234
所在地:中國大陸 *此為代購商品
書號:1688658
可大量預訂,請先連絡。

內容簡介

本書主要介紹了反爬蟲的相關技術,內容涵蓋了爬蟲工具、加密演算法、App爬蟲等,從理論到案例實踐,深入淺出。本書詳細講解了常用的抓包工具、反爬蟲機制、驗證碼識別、動態網頁反爬蟲、JavaScript文件處理。本書聚焦加密數據的破解、App應用爬蟲以及破解方法、部署爬蟲程序。對於以上內容,本書進行細分總結,將相關知識點都納入其中,形成一套完整的體系。 本書適合Python愛好者、爬蟲工程師、數據分析師,以及高等院校計算機科學技術、軟體工程、網路工程等相關專業的師生。

作者簡介

任傑麟,碩士研究生學歷,從事Python、Java方向的技術研發,擁有超過十五年的社交、金融、石油行業開發經驗,始終戰鬥在編碼第一線,平時喜歡鑽研開源技術和數學。負責過石油領域數據分析的開發,以及人工智慧的開發工作,長期擔任數據爬取與數據分析的項目負責人,對網路爬蟲和反爬蟲有著較多的應用和感悟。

目錄

第1章 無處不在的反爬蟲
1 1 學習反爬蟲的理由
1 1 1 反爬蟲的定義
1 1 2 反爬蟲對信息的保護
1 1 3 防止惡意競爭與知識產權侵犯
1 1 4 反爬蟲對網站的維護
1 1 5 爬蟲與反爬蟲的相愛相殺:反爬蟲對抗爬蟲
1 2 什麼樣的爬蟲會被反爬呢?
1 2 1 「裸體」爬蟲
1 2 2 「索取無度」的爬蟲
1 2 3 「不守規定」的爬蟲
1 3 爬蟲程序員的噩夢:多種多樣的反爬蟲機制
1 3 1 基於IP反爬蟲:封鎖IP
1 3 2 基於request headers反爬蟲:檢查「身份證」
1 3 3 基於用戶行為的反爬蟲
1 3 4 動態頁面的反爬蟲
1 3 5 登錄限制(cookie限制)
1 3 6 驗證碼限制
1 3 7 JavaScript加密
1 3 8 文本混淆反爬蟲:從根本上偽裝信息
1 4 本章小結
第2章 抓包利器的使用
2 1 抓包
2 1 1 什麼是抓包?
2 1 2 抓包的意義
2 1 3 HTTP的抓包原理
2 1 4 HTTPS的抓包原理
2 1 5 常見抓包工具的對比
2 2 抓包工具Charles的使用
2 2 1 什麼是Charles?
2 2 2 Charles的抓包原理
2 2 3 Charles的配置
2 2 4 使用Charles對網站進行抓包
2 2 5 使用Charles對App進行抓包
2 3 抓包工具Fiddler的使用
2 3 1 Fiddler簡介
2 3 2 Fiddler與Charles的區別
2 3 3 Fiddler證書的安裝
2 3 4 Fiddler的使用
2 4 抓包工具Mitmproxy的使用
2 4 1 Mitmproxy簡介
2 4 2 Mitmproxy的工作原理
2 4 3 Mitmproxy的工作模式
2 4 4 Mitmproxy的使用
2 5 抓包工具Wireshark的使用
2 5 1 Wireshark簡介
2 5 2 Wireshark與Fiddler的區別
2 5 3 Wireshark的使用
2 6 本章小結
第3章 信息校驗型反爬蟲
3 1 信息校驗反爬蟲概述
3 1 1 信息校驗反爬蟲的原理
3 1 2 信息校驗反爬蟲的常見類型
3 2 useragent反爬蟲
3 2 1 什麼是UA?
3 2 2 UA的改變方法
3 3 cookie反爬蟲
3 3 1 HTTP機制
3 3 2 cookie的作用
3 3 3 session和cookie的關係
3 4 Referer反爬蟲
3 4 1 Referer的意義
3 4 2 Referer的破解方法
3 5 簽名驗證反爬蟲
3 5 1 簽名驗證的原理
3 5 2 簽名驗證的破解
3 6 本章小結
第4章 驗證碼識別
4 1 什麼是驗證碼?
4 1 1 驗證碼原理
4 1 2 驗證碼的應用
4 1 3 驗證碼分類
4 2 圖像識別技術
4 2 1 圖像識別技術的基礎知識
4 2 2 什麼是OCR?
4 2 3 OCR原理
4 2 4 什麼是Tesseract?
4 3 打碼平台的使用
4 3 1 什麼是打碼平台?
4 3 2 如何使用打碼平台
4 4 驗證碼爬蟲案例
4 4 1 分析測試網站
4 4 2 實現模擬登錄
4 4 3 核心代碼
4 5 本章小結
第5章 模擬登錄
5 1 requests模擬登錄
5 1 1 requests的基礎操作
5 1 2 get請求方式
5 1 3 cookie的使用
5 1 4 post請求方式
5 1 5 get請求失敗的案例
5 2 selenium模擬登錄
5 2 1 什麼是selenium?
5 2 2 安裝selenium及驅動
5 2 3 網頁結構與xpath簡介
5 2 4 selenium的元素定位
5 2 5 使用selenium進行交互
5 2 6 使用selenium進行模擬登錄
5 3 案例——selenium+驗證碼模擬登錄
5 3 1 原理分析
5 3 2 獲取驗證碼圖片
5 3 3 實現selenium+驗證碼模擬登錄
5 3 4 核心代碼
5 4 本章小結
第6章 搭建IP代理池爬蟲
6 1 IP的基礎知識
6 1 1 IP地址的簡述
6 1 2 什麼是IPv4?
6 1 3 什麼是IPv6?
6 1 4 IPv4與IPv6的對比
6 2 IP封鎖
6 2 1 IP封鎖反爬蟲的基本原理
6 2 2 IP封鎖的影響
6 3 如何突破IP封鎖
6 3 1 降低爬蟲性能——設置休眠時間
6 3 2 使用IP代理
6 4 IP代理
6 4 1 什麼是IP代理?
6 4 2 為什麼要進行IP代理?
6 5 IP代理池
6 5 1 實現IP代理
6 5 2 如何構建IP代理池
6 6 案例1——urllib的IP代理
6 6 1 代碼簡述
6 6 2 完整代碼
6 7 案例2——構建IP代理池
6 7 1 代理網站分析
6 7 2 代理IP獲取
6 7 3 代理IP檢測與保存
6 7 4 完整代碼
6 8 本章小結
第7章 針對動態渲染頁面的反爬
7 1 動態渲染網頁的原理
7 1 1 靜態頁面和動態頁面
7 1 2 JavaScript實現渲染的簡單原理
7 2 動態渲染實現的方式
7 2 1 自動執行的非同步請求
7 2 2 點擊事件和計數
7 2 3 下拉載入和非同步請求
7 3 解決動態渲染的反爬工具
7 3 1 selenium
7 3 2 puppeteer
7 3 3 Splash
7 4 案例——爬取漫畫網漫畫數據
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理