Python網絡爬蟲發從入門到精通 (第2版) 劉延林 徐清徽 9787301359495 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:北京大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$566
商品編號: 9787301359495
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202503*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Python網絡爬蟲發從入門到精通 (第2版)
ISBN:9787301359495
出版社:北京大學
著編譯者:劉延林 徐清徽
頁數:344
所在地:中國大陸 *此為代購商品
書號:1713818
可大量預訂,請先連絡。

內容簡介

本書共分4篇,針對Python爬蟲初學者,從零開始系統地講解了如何利用Python進行網絡爬蟲程序開發。 第1篇快速入門篇(第1~9章):本篇主要介紹了Python環境的搭建和一些Python的基礎語法知識、Python爬蟲入門知識及基本的使用方法、Ajax數據的分析和抓取、動態渲染頁面數據的爬取、網站代理的設置與使用、驗證碼的識別與破解,以及App數據抓取、數據的存儲方法等內容。 第2篇技能進階篇(第10~12章):本篇主要介紹了PySpider和Scrapy兩個常用爬蟲框架的基本使用方法、爬蟲的部署方法,以及數據分析、數據清洗常用庫的使用方法。 第3篇項目實戰篇(第13章):本篇以2個綜合實戰項目,詳細地講解了Python數據爬蟲開始與實戰應用。本篇對全書內容進行了總結回顧,強化讀者的實操水平。 第4篇技能拓展篇(第14章):本篇從數據爬取、數據清洗和數據分析三個角度,介紹了一常用AI技術的實用技巧。運用這些技巧,讀者可以提高網絡爬蟲程序的編寫速度和數據分析效率。 本書案例豐富,注重實戰,既適合Python程序員和爬蟲愛好者閱讀學習,也適合作為廣大職業院校相關專業的教學用書。

作者簡介

劉延林,雲鏡團隊創始人,擁有多年網絡爬蟲開發經驗,著有《Python網絡爬蟲開發從入門到精通》,擅長Python網絡爬蟲、Web、數據挖掘與分析、網絡安全、產品研發等領域。

目錄

第1篇 快速入門篇
第1章 Python基礎
1 1 Python環境搭建
1 1 1 Windows下Python環境的安裝
1 1 2 Linux下Python環境的安裝
1 1 3 macOS下Python環境的安裝
1 1 4 IDE開發工具介紹
1 2 Python入門
1 2 1 第一個Python程序
1 2 2 Python註釋
1 2 3 數據類型和變數
1 2 4 字元串和編碼
1 2 5 列表
1 2 6 元組
1 2 7 字典
1 2 8 集合
1 2 9 條件語句
1 2 10 循環語句
1 2 11 函數
1 2 12 類
1 2 13 推導式
1 2 14 賦值表達式
1 3 新手 實訓
實訓一:使用for循環實現九九乘法表
實訓二:判斷閏年
實訓三:計算二次方程
1 4 新手問答
本章小結
第2章 Python爬蟲入門
2 1 爬蟲的分類
2 1 1 通用網絡爬蟲
2 1 2 聚焦網絡爬蟲
2 1 3 增量式網絡爬蟲
2 1 4 深層網絡爬蟲
2 2 爬蟲的基本結構及工作流程
2 3 爬蟲策略
2 3 1 深度優先遍歷策略
2 3 2 寬度優先遍歷策略
2 3 3 大站優先策略
2 3 4 最佳優先搜索策略
2 4 HTTP基本原理
2 4 1 URI和URL介紹
2 4 2 超文本
2 4 3 HTTP和HTTPS
2 4 4 HTTP請求過程
2 5 網頁基礎
2 5 1 網頁的組成
2 5 2 網頁的結構
2 6 Session和Cookie
2 6 1 Session和Cookie的工作原理
2 6 2 Session和Cookie的區別
2 6 3 常見誤區
2 7 新手 實訓
實訓一:編寫網頁
實訓二:在網頁中插入標籤
2 8 新手問答
本章小結
第3章 基本庫的使用
3 1 urllib
3 1 1 urlopen()
3 1 2 簡單抓取網頁
3 1 3 設置請求超時
3 1 4 使用data參數提交數據
3 1 5 Request
3 1 6 簡單使用Request
3 1 7 Request高級用法
3 1 8 使用代理
3 1 9 認證登錄
3 1 10 Cookie設置
3 1 11 HTTPResponse
3 1 12 錯誤解析
3 2 requests
3 2 1 requests庫的安裝
3 2 2 requests庫的使用方法介紹
3 2 3 requests get()
3 2 4 requests庫的異常
3 2 5 request head()
3 2 6 requests post()
3 2 7 requests put()和requests patch()
3 3 re正則使用
3 3 1 re match()
3 3 2 re search()
3 3 3 re match()與re search()的區別
3 3 4 檢索和替換
3 3 5 re compile()
3 3 6 findall()
3 4 XPath
3 4 1 XPath的使用方法
3 4 2 利用實例講解XPath的使用
3 4 3 獲取所有節點
3 4 4 獲取子節點
3 4 5 獲取文本信息
3 4 6 通過谷歌瀏覽器獲取XPath表達式
3 5 BeautifulSoup
3 5 1 BeautifulSoup模塊的安裝
3 5 2 定位節點
3 5 3 提取數據
3 6 新手 實訓
實訓一:requests庫爬取豆瓣電影Top250頁面
實訓二:百度搜索關鍵字提交
3 7 新手問答
本章小結
第4章 Ajax數據抓取
4 1 Ajax簡介
4 1 1 實例引入
4 1 2 Ajax的基本原理
4 1 3 Ajax方法分析
4 2 使用Python模擬Ajax請求數據
4 2 1 分析請求
4 2 2 分析響應結果
4 2 3 編寫代碼模擬抓取
4 3 新手 實訓
實訓一:分析獵聘網的xhr請求並編寫代碼模擬抓取數據
實訓二:分析南方航空官網的機票查詢xhr請求抓取數據
4 4 新手問答
本章小結
第5章 動態渲染頁面爬取
5 1 Selenium的使用
5 1 1 安裝Selenium庫
5 1 2 Selenium定位方法
5 1 3 控制瀏覽器操作
5 1 4 WebDriver常用方法
5 1 5 滑鼠事件和鍵盤事件
5 1 6 獲取斷言信息
5 1 7 設置元素等待
5 1 8 多表單切換
5 1 9 下拉框選擇
5 1 10 調用JavaScript代碼
5 1 11 窗口截圖
5 1 12 無頭瀏覽模式
5 2 Playwright的基本使用
5 2 1 Playwright的安裝
5 2 2 Playwright定位方法
5 2 3 Playwright交互方法
5 3 新手 實訓
實訓一:模擬登錄豆瓣
實訓二:使用Playwright模擬百度搜索
5 4 新手問答
本章小結
第6章 代理的設置與使用
6 1 代理設置
6 1 1 urllib代理設置
6 1 2 requests代理設置
6 1 3 Selenium代理設置
6 1 4 Playwright代理設置
6 2 代理池構建
6 2 1 獲取IP
6 2 2 驗證代理是否可用
6
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理