Python網絡爬蟲入門到實戰 楊涵文 周培源 陳姍姍 9787111730521 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$630
商品編號: 9787111730521
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202307*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Python網絡爬蟲入門到實戰
ISBN:9787111730521
出版社:機械工業
著編譯者:楊涵文 周培源 陳姍姍
叢書名:計算機前沿技術叢書
頁數:292
所在地:中國大陸 *此為代購商品
書號:1541853
可大量預訂,請先連絡。

內容簡介

本書介紹了Python3網路爬蟲的常見技術。首先介紹了網頁的基礎知識,然後介紹了urllib、Requests請求庫以及XPath、BeautifulSoup等解析庫,接著介紹了selenium對動態網站的爬取和Scrapy爬蟲框架,最後介紹了Linux基礎,便於讀者自主部署編寫好的爬蟲腳本。本書所有代碼和相關素材可以到GitHub下載獲取,地址為https://github com/sfvsfv/Crawer。 本書主要面向對網路爬蟲感興趣的初學者。

作者簡介

楊涵文,網名「川川」,現致力於全棧開發領域,在大數據分析與挖掘、機器學習、人工智能、網站開發等領域實戰經驗豐富。CSDN內容合伙人、阿里雲博客專家,全網20萬粉絲博主,熱衷於技術研究,樂於分享。

目錄

前言
第1章 HTML與CSS基礎
1 1 概述引導
1 2 Hbuilder軟體下載與使用
1 3 HTML基礎
1 3 1 基本架構
1 3 2 標題和段落標籤
1 3 3 文字標籤
1 3 4 圖像標籤
1 3 5 超鏈接標籤
1 3 6 塊標籤
1 3 7 列表標籤
1 3 8 音頻視頻標籤
1 3 9 表格標籤
1 3 10 表單標籤
1 3 11 框架標籤
1 4 免費網頁部署
1 5 為什麼要使用CSS框架
1 6 選擇器
1 6 1 標籤選擇器
1 6 2 類選擇器
1 6 3 ID選擇器
1 6 4 全局選擇器
1 6 5 屬性選擇器
1 6 6 包含選擇器
1 6 7 選擇器的綜合使用
1 7 CSS和HTML的結合方式
1 7 1 行內樣式
1 7 2 內嵌樣式
1 7 3 鏈接樣式
1 7 4 導入樣式
1 7 5 優先順序
1 8 CSS的常見屬性
1 8 1 字體屬性
1 8 2 文本屬性
1 8 3 尺寸屬性
1 8 4 背景屬性
1 8 5 製作照片牆
1 9 作業習題
1 9 1 HTML作業習題
1 9 2 CSS作業習題/Python網路爬蟲入門到實戰
第2章 urllib、Requests基礎與實戰
2 1 urllib的使用
2 1 1 urlopen網址請求
2 1 2 網頁的保存和異常處理
2 1 3 構造請求對象Requests
2 1 4 添加請求頭
2 1 5 SSL認證
2 2 萬能視頻下載
2 3 Requests中get的使用
2 3 1 Requests基礎:代碼獲取
2 3 2 Requests基礎:構建請求
2 3 3 獲取cookie
2 3 4 添加請求頭
2 3 5 二進位數據獲取
2 4 Requests中post的使用
2 4 1 提交數據表單
2 4 2 添加請求頭
2 4 3 提交json
2 4 4 普通文件上傳
2 5 Requests進階
2 5 1 URLError和HTTPError
2 5 2 Fiddler的下載與簡單使用
2 5 3 登錄網站
2 5 4 代理設置
2 6 實戰演練
2 6 1 獲取某搜索的代碼
2 6 2 下載圖片到本地
2 6 3 下載視頻到本地
2 6 4 爬取翻譯網站/

目錄


第3章 正則表達式基礎與實戰
3 1 正則表達式的定義
3 2 Python中的正則表達式
3 3 正則表達式函數
3 3 1 findall()函數
3 3 2 search()函數
3 3 3 split()函數
3 3 4 sub()函數
3 3 5 compile函數
3 4 特殊字元的使用
3 4 1 列表符
3 4 2 點符號
3 4 3 開始符和結束符
3 4 4 星號
3 4 5 加號
3 4 6 集合符號
3 4 7 或符號
3 5 特殊序列
3 5 1 匹配指定字元
3 5 2 匹配開頭、結尾和中間
3 5 3 匹配數字與非數字
3 5 4 空格與非空格匹配
3 5 5 數字與字母的匹配
3 5 6 貪婪模式與非貪婪模式
3 6 集合練習
3 6 1 指定的符號匹配
3 6 2 匹配任意範圍內的小寫字母
3 7 匹配對象
3 8 正則實戰:段子爬取
3 9 作業習題
第4章 XPath基礎與實戰
4 1 開始使用XPath
4 1 1 常見的HTML操作
4 1 2 常見的XML操作
4 1 3 瀏覽器使用XPath調試
4 1 4 谷歌插件的安裝與XPath Helper的使用
4 1 5 瀏覽器複製XPath
4 2 屬性的匹配
4 2 1 根據具體屬性匹配
4 2 2 通過屬性值的欄位匹配
4 2 3 屬性值獲取
4 3 XPath處理HTML常用方法
4 4 實戰學習:房產網站爬取
4 5 多線程爬蟲
4 5 1 進程和線程
4 5 2 Python中的多線程與單線程
4 5 3 單線程修改為多線程
4 6 作業習題
第5章 Beautiful Soup基礎與實戰
5 1 什麼是Beautiful Soup
5 2 解析器
5 3 解析庫的基本使用
5 3 1 代碼的排版
5 3 2 網頁文檔處理
5 3 3 獲取節點中的文本
5 3 4 根據屬性匹配
5 4 find_all方法搜索節點
5 4 1 基本使用
5 4 2 通過標籤搜索
5 4 3 非參數搜索
5 4 4 CSS搜索
5 4 5 通過文本搜索
5 4 6 返回數量限制
5 5 find方法搜索節點
5 6 CSS選擇器
5 6 1 通過標籤名查找
5 6 2 通過標籤的類名查找
5 6 3 通過標籤的id查找
5 6 4 通過屬性查找
5 7 實戰一:爬取詩詞網站
5 8 實戰二:爬取求職網站
第6章 selenium自動化測試與實戰
6 1 環境搭建
6 2 單個元素定位
6 2 1 id定位
6 2 2 name定位
6 2 3 class_name定位
6 2 4 link_text定位
6 2 5 tag_name定位
6 2 6 XPath定位
6 2 7 通過CSS定位
6 2 8 使用By類定位
6 2 9 總結
6 3 元素等待
6 3 1 強制等待
6 3 2 顯示等待
6 3 3 隱式等待
6 4 瀏覽器控制
6 4 1 控制瀏覽器大小
6 4 2 控制瀏覽器前進後退與刷新
6 4 3 文本輸入輸出與表單提交
6 5 滑鼠控制
6 5 1 滑鼠
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理