深入解析Python反爬蟲任傑麟苟如意 9787111764076 【台灣高等教育出版社】

Name: 深入解析Python反爬蟲 任傑麟 苟如意 9787111764076 【台灣高等教育出版社】
Brand: abooksthep
Price: 630.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：機械工業

NT$630

商品編號:

供貨狀況: 尚有庫存

加入最愛

商品介紹

*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202410*若逾兩年請先於私訊洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：深入解析Python反爬蟲
ISBN：9787111764076
出版社：機械工業
著編譯者：任傑麟苟如意
頁數：234
所在地：中國大陸 *此為代購商品
書號：1688658
可大量預訂，請先連絡。

內容簡介

本書主要介紹了反爬蟲的相關技術，內容涵蓋了爬蟲工具、加密演算法、App爬蟲等，從理論到案例實踐，深入淺出。本書詳細講解了常用的抓包工具、反爬蟲機制、驗證碼識別、動態網頁反爬蟲、JavaScript文件處理。本書聚焦加密數據的破解、App應用爬蟲以及破解方法、部署爬蟲程序。對於以上內容，本書進行細分總結，將相關知識點都納入其中，形成一套完整的體系。本書適合Python愛好者、爬蟲工程師、數據分析師，以及高等院校計算機科學技術、軟體工程、網路工程等相關專業的師生。

作者簡介

任傑麟，碩士研究生學歷，從事Python、Java方向的技術研發，擁有超過十五年的社交、金融、石油行業開發經驗，始終戰鬥在編碼第一線，平時喜歡鑽研開源技術和數學。負責過石油領域數據分析的開發，以及人工智慧的開發工作，長期擔任數據爬取與數據分析的項目負責人，對網路爬蟲和反爬蟲有著較多的應用和感悟。

第1章無處不在的反爬蟲
1 1 學習反爬蟲的理由
1 1 1 反爬蟲的定義
1 1 2 反爬蟲對信息的保護
1 1 3 防止惡意競爭與知識產權侵犯
1 1 4 反爬蟲對網站的維護
1 1 5 爬蟲與反爬蟲的相愛相殺：反爬蟲對抗爬蟲
1 2 什麼樣的爬蟲會被反爬呢？
1 2 1 「裸體」爬蟲
1 2 2 「索取無度」的爬蟲
1 2 3 「不守規定」的爬蟲
1 3 爬蟲程序員的噩夢：多種多樣的反爬蟲機制
1 3 1 基於IP反爬蟲：封鎖IP
1 3 2 基於request headers反爬蟲：檢查「身份證」
1 3 3 基於用戶行為的反爬蟲
1 3 4 動態頁面的反爬蟲
1 3 5 登錄限制（cookie限制）
1 3 6 驗證碼限制
1 3 7 JavaScript加密
1 3 8 文本混淆反爬蟲：從根本上偽裝信息
1 4 本章小結
第2章抓包利器的使用
2 1 抓包
2 1 1 什麼是抓包？
2 1 2 抓包的意義
2 1 3 HTTP的抓包原理
2 1 4 HTTPS的抓包原理
2 1 5 常見抓包工具的對比
2 2 抓包工具Charles的使用
2 2 1 什麼是Charles？
2 2 2 Charles的抓包原理
2 2 3 Charles的配置
2 2 4 使用Charles對網站進行抓包
2 2 5 使用Charles對App進行抓包
2 3 抓包工具Fiddler的使用
2 3 1 Fiddler簡介
2 3 2 Fiddler與Charles的區別
2 3 3 Fiddler證書的安裝
2 3 4 Fiddler的使用
2 4 抓包工具Mitmproxy的使用
2 4 1 Mitmproxy簡介
2 4 2 Mitmproxy的工作原理
2 4 3 Mitmproxy的工作模式
2 4 4 Mitmproxy的使用
2 5 抓包工具Wireshark的使用
2 5 1 Wireshark簡介
2 5 2 Wireshark與Fiddler的區別
2 5 3 Wireshark的使用
2 6 本章小結
第3章信息校驗型反爬蟲
3 1 信息校驗反爬蟲概述
3 1 1 信息校驗反爬蟲的原理
3 1 2 信息校驗反爬蟲的常見類型
3 2 useragent反爬蟲
3 2 1 什麼是UA？
3 2 2 UA的改變方法
3 3 cookie反爬蟲
3 3 1 HTTP機制
3 3 2 cookie的作用
3 3 3 session和cookie的關係
3 4 Referer反爬蟲
3 4 1 Referer的意義
3 4 2 Referer的破解方法
3 5 簽名驗證反爬蟲
3 5 1 簽名驗證的原理
3 5 2 簽名驗證的破解
3 6 本章小結
第4章驗證碼識別
4 1 什麼是驗證碼？
4 1 1 驗證碼原理
4 1 2 驗證碼的應用
4 1 3 驗證碼分類
4 2 圖像識別技術
4 2 1 圖像識別技術的基礎知識
4 2 2 什麼是OCR？
4 2 3 OCR原理
4 2 4 什麼是Tesseract？
4 3 打碼平台的使用
4 3 1 什麼是打碼平台？
4 3 2 如何使用打碼平台
4 4 驗證碼爬蟲案例
4 4 1 分析測試網站
4 4 2 實現模擬登錄
4 4 3 核心代碼
4 5 本章小結
第5章模擬登錄
5 1 requests模擬登錄
5 1 1 requests的基礎操作
5 1 2 get請求方式
5 1 3 cookie的使用
5 1 4 post請求方式
5 1 5 get請求失敗的案例
5 2 selenium模擬登錄
5 2 1 什麼是selenium？
5 2 2 安裝selenium及驅動
5 2 3 網頁結構與xpath簡介
5 2 4 selenium的元素定位
5 2 5 使用selenium進行交互
5 2 6 使用selenium進行模擬登錄
5 3 案例——selenium+驗證碼模擬登錄
5 3 1 原理分析
5 3 2 獲取驗證碼圖片
5 3 3 實現selenium+驗證碼模擬登錄
5 3 4 核心代碼
5 4 本章小結
第6章搭建IP代理池爬蟲
6 1 IP的基礎知識
6 1 1 IP地址的簡述
6 1 2 什麼是IPv4？
6 1 3 什麼是IPv6？
6 1 4 IPv4與IPv6的對比
6 2 IP封鎖
6 2 1 IP封鎖反爬蟲的基本原理
6 2 2 IP封鎖的影響
6 3 如何突破IP封鎖
6 3 1 降低爬蟲性能——設置休眠時間
6 3 2 使用IP代理
6 4 IP代理
6 4 1 什麼是IP代理？
6 4 2 為什麼要進行IP代理？
6 5 IP代理池
6 5 1 實現IP代理
6 5 2 如何構建IP代理池
6 6 案例1——urllib的IP代理
6 6 1 代碼簡述
6 6 2 完整代碼
6 7 案例2——構建IP代理池
6 7 1 代理網站分析
6 7 2 代理IP獲取
6 7 3 代理IP檢測與保存
6 7 4 完整代碼
6 8 本章小結
第7章針對動態渲染頁面的反爬
7 1 動態渲染網頁的原理
7 1 1 靜態頁面和動態頁面
7 1 2 JavaScript實現渲染的簡單原理
7 2 動態渲染實現的方式
7 2 1 自動執行的非同步請求
7 2 2 點擊事件和計數
7 2 3 下拉載入和非同步請求
7 3 解決動態渲染的反爬工具
7 3 1 selenium
7 3 2 puppeteer
7 3 3 Splash
7 4 案例——爬取漫畫網漫畫數據
詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於PChome商店街私訊告知ISBN或書號，我們即儘速上架。