Python爬蟲實戰基礎 李科均 9787302626565 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$693
商品編號: 9787302626565
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202306*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:Python爬蟲實戰基礎
ISBN:9787302626565
出版社:清華大學
著編譯者:李科均
頁數:414
所在地:中國大陸 *此為代購商品
書號:1509951
可大量預訂,請先連絡。

內容簡介

本書介紹Python網路爬蟲開發從業者應掌握的基礎技能。本書以網路爬蟲為核心,涉及大大小小數十個能力體系。本書的前半部分介紹爬蟲開發的基礎知識,包括爬蟲開發必備的環境搭建方法、開發中常用工具的使用方法和技巧、網頁的構成原理和網頁信息提取的方法、常用資料庫的使用方法和應用場景,如通過Redis內置的布隆過濾器實現大規模URL地址的去重任務。本書的後半部分主要講解網路爬蟲開發所需的必要能力,包括網路通信的底層原理、背後涉及的互聯網協議標準及如何對這些協議進行分析並加以利用,使用Docker部署網路爬蟲所需的環境和爬蟲項目的打包部署,使用網路爬蟲的核心請求庫實現與伺服器端和客戶端的通信和交互,使用自動化神器Selenium對複雜的爬蟲需求進行快速實現,以及網路爬蟲的多任務開發,重點是通過多線程和多進程來提高爬蟲效率。 本書面向準備從事或正在從事網路爬蟲開發的從業者以及對網路爬蟲有濃厚興趣的愛好者。

目錄

第1章 基礎開發環境
1 1 Docker環境的搭建
1 1 1 安裝Docker
1 1 2 用Docker安裝MySQL
1 1 3 用Docker安裝Redis
1 1 4 用Docker安裝MongoDB
1 1 5 用Docker安裝Selenium Grid
1 2 Python的開發環境
1 2 1 Python的優點、缺點
1 2 2 Python解釋器
1 2 3 Python IDE
1 3 JavaScript的運行環境
1 4 輔助工具的安裝
1 4 1 安裝Git
1 4 2 安裝ADB驅動
1 4 3 安裝Fiddler
1 4 4 安裝Postman
1 4 5 XPath測試插件
第2章 HTML頁面的信息提取
2 1 HTML頁面解析概述
2 1 1 HTML頁面的構成原理
2 1 2 Python提取HTML頁面信息的方式
2 2 XPath提取HTML頁面信息
2 2 1 XPath基礎
2 2 2 XPath教程
2 2 3 XPath技巧
2 3 正則表達式
2 3 1 基本語法
2 3 2 表達式全集
2 3 3 表達式字元組、優先權
2 3 4 表達式的分組與引用
2 3 5 Python re模塊
2 4 案例
2 4 1 正則校驗公民身份號碼的合法性
2 4 2 下載微信文章及其靜態資源
第3章 日誌模塊
3 1 日誌基礎
3 1 1 應用場景及重要性
3 1 2 日誌的使用
3 2 四大組件之Logger(記錄器)
3 2 1 Logger的作用
3 2 2 Logger的屬性和方法
3 2 3 Logger的常用配置方法
3 2 4 案例:為日誌記錄器添加自定義過濾器
3 3 四大組件之Handler(處理器)
3 3 1 Handle的作用
3 3 2 Handle的屬性和方法
3 3 3 Handle的常用方法
3 3 4 內置Handler類型及功能
3 3 5 案例一:將日誌寫入磁碟文件
3 3 6 案例二:將日誌文件按時間分割
3 3 7 案例三:將日誌文件按大小分割
3 3 8 案例四:給指定郵箱發送日誌消息
3 3 9 案例五:Web日誌伺服器的傳參、認證和調用
3 4 四大組件之Formatter(格式化器)
3 4 1 Formatter的屬性和方法
3 4 2 可選格式化欄位
3 5 四大組件之Filters(過濾器)
3 5 1 Filters的屬性和方法
3 5 2 自定義Filters
3 6 LogRecord對象
3 6 1 LogRecord的屬性和方法
3 6 2 構造LogRecord實例化對象
3 6 3 案例:Web日誌伺服器恢復LogRecord對象
3 7 日誌的配置
3 7 1 顯式配置
3 7 2 通過fileConfig配置
3 7 3 通過dictConfig配置
第4章 資料庫操作
4 1 通過ORM模型操作MySQL
4 1 1 什麼是ORM模型
4 1 2 SQLAlchemy是什麼
4 1 3 SQLAlchemy基礎
4 1 4 資料庫引擎配置
4 1 5 創建會話
4 1 6 創建聲明性類
4 1 7 定義數據列及類型
4 1 8 增、改、查、刪
4 1 9 ORM事務操作
4 1 10 常用關係表的創建
4 1 11 關係表數據的插入
4 1 12 連接查詢
4 1 13 關係表數據的刪除
4 2 MongoDB資料庫
4 2 1 MongoDB基礎
4 2 2 MongoDB文檔的增、刪、改
4 2 3 MongoDB文檔查詢
4 2 4 MongoDB的聚合
4 2 5 MongoDB索引操作
4 2 6 MongoDB的複製
4 2 7 MongoDB的備份與恢復
4 2 8 Python與MongoDB交互
4 3 Redis操作
4 3 1 Redis基礎
4 3 2 Python操作Redis的流程
4 3 3 Python中常用的Redis命令
4 3 4 Python中使用Redis去重
4 3 5 Redis內置布隆過濾器
4 3 6 使用Redis作消息隊列
4 3 7 打造Redis發布訂閱框架
第5章 機制與協議
5 1 TCP/IP協議簇
5 1 1 互聯網協議套件
5 1 2 TCP/IP協議簇的組成
5 1 3 TCP/IP參考模型
5 2 TCP與UDP協議
5 2 1 socket通信
5 2 2 UDP協議
5 2 3 TCP協議
5 2 4 TCP的三次握手
5 2 5 TCP的四次揮手
5 2 6 TCP長連接
5 3 HTTP與HTTPS協議
5 3 1 HTTP協議的實現
5 3 2 使用socket實現HTTP協議伺服器
5 3 3 HTTPS協議的實現
5 3 4 關於TLS與SSL協議
5 3 5 一次爬蟲請求的過程
5 3 6 HTTP響應狀態碼
5 3 7 HTTP請求頭與響應頭
5 4 WebSocket協議
5 4 1 協議內容
5 4 2 Python連接WebSocket
5 4 3 案例:虛擬貨幣實時價格爬蟲
5 5 SMTP協議與IMAP協議
5 5 1 SMTP協議
5 5 2 IMAP協議
5 5 3 Python使用SMTP關鍵介面
5 5 4 Python使用IMAP關鍵介面
5 5 5 案例一:發送HTML格式的郵件
5 5 6 案例二:發送帶附件的郵件
5 5 7 案例三:發送顯示圖片的HTML格式的郵件
5 5 8 案例四:自動讀取郵箱驗證碼
5 6 Robots協議
5 7 安全與會話機制
5 7 1 CSRF攻擊與保護
5 7 2 CSRF驗證過程
5 7 3 Cookie機制
5 7 4 會話
5 7 5 Token與JWT
5 7 6
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理