Python網絡爬蟲-從入門到精通 (附微課) (本科) 呂雲翔 9787115611901 【台灣高等教育出版社】

Name: Python網絡爬蟲-從入門到精通 (附微課) (本科) 呂雲翔 9787115611901 【台灣高等教育出版社】
Brand: abooksthep
SKU: 9787115611901
Price: 317.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：人民郵電

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

NT$317

商品編號: 9787115611901

供貨狀況: 尚有庫存

加入最愛

商品介紹

*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202307*若逾兩年請先於客服中心或Line洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：Python網絡爬蟲-從入門到精通 (附微課) (本科)
ISBN：9787115611901
出版社：人民郵電
著編譯者：呂雲翔
叢書名：數據科學與統計系列規劃教材
頁數：196
所在地：中國大陸 *此為代購商品
書號：1540727
可大量預訂，請先連絡。

編輯推薦
適讀人群：本書適合高等院校數據科學、統計學、計算機科學、軟體工程等相關專業的讀者，也適合 Python 語言初學者、網路爬蟲技術愛好者作為參考工具書使用。
1 由北京航空航天大學擁有近20年軟體開發、計算機教學經驗的教師編寫，權威性高，內容質量上乘
2 全新內容結構布局，豐富要點提示及課程目標，落實翻轉課堂教學理念
3 基礎詳解+大量案例實戰，立足於零基礎人群實現網路爬蟲從入門到精通
4 全新的豐富配套數字化資源，提供語法速查表與演算法框架表，提供完整案例運行源代碼

內容簡介
本書主要介紹如何使用Python語言進行網路爬蟲程序的開發，從Python語言的基本特性入手，詳細介紹Python網路爬蟲開發的多個方面，涉及HTTP、HTML、正則表達式、JavaScript、自然語言處理、數據處理與科學計算等不同領域的內容。全書共12章，包括基礎篇、進階篇、提高篇和實戰篇4個部分。基礎篇包括第1、2、3章，分別為Python基礎及網路爬蟲、靜態網頁抓取、數據存儲。進階篇包括第4、5、6章，分別為JavaScript與動態內容、模擬登錄與驗證碼、爬蟲數據的分析與處理。提高篇包括第7、8、9章，分別為爬蟲的靈活性和多樣性、Selenium模擬瀏覽器與網站測試、爬蟲框架Scrapy與反爬蟲。實戰篇提供了3個實戰項目供讀者學習參考。本書內容覆蓋網路數據抓取與爬蟲編程中的主要知識和前沿技術。同時，本書在重視理論基礎的前提下，從實用性和豐富度出發，結合實例演示爬蟲程序編寫的核心流程，將理論與實踐結合，力求提高讀者的網路爬蟲實操技能。
本書可作為高等院校數據科學、統計學、計算機科學、軟體工程等相關專業課程的教材，也可作為Python語言初學者、網路爬蟲技術愛好者的參考書。

作者簡介
呂雲翔比利時布魯塞爾自由大學應用科學學院應用信息技術專業碩士、經濟學院工商管理專業碩士，北京航空航天大學軟體學院副教授，碩士生導師。主要研究方向：軟體工程、人工智能、大數據。具有多年的軟體開發、項目管理、計算機教學經驗，對IT行業具有較全面的認識，編著教材多部。曾獲得北航教學成果一等獎、二等獎（教材）、三等獎（教材）。

目錄
目錄
基礎篇
第 1章 Python基礎及網路爬蟲 1
1 1 了解Python語言 1
1 1 1 Python是什麼 1
1 1 2 Python的應用現狀 2
1 2 配置安裝Python開發環境 3
1 2 1 在Windows上安裝 3
1 2 2 在Ubuntu和macOS上安裝 3
1 2 3 IDE的使用：以PyCharm為例 4
1 2 4 Jupyter Notebook簡介 6
1 3 Python基礎知識 7
1 3 1 「Hello，World!」與數據類型 7
1 3 2 邏輯語句 12
1 3 3 Python中的函數與類 14
1 3 4 更深入了解Python 16
1 4 網際網路、HTTP與HTML 16
1 4 1 網際網路與HTTP 16
1 4 2 HTML 17
1 5 Hello Spider 19
1 5 1 編寫第一個爬蟲程序 19
1 5 2 對爬蟲的思考 21
1 6 分析網站 22
1 6 1 robots txt與Sitemap簡介 22
1 6 2 網站技術分析 24
1 6 3 網站所有者信息分析 25
1 6 4 使用開發者工具檢查目標網頁 26
第一章節實訓：Python環境的配置與爬蟲的運行 28
思考與練習 28
第 2章靜態網頁抓取 29
2 1 從抓取開始 29
2 2 正則表達式 30
2 2 1 什麼是正則表達式 30
2 2 2 正則表達式的簡單使用 31
2 3 BeautifulSoup爬蟲 33
2 3 1 安裝BeautifulSoup 33
2 3 2 BeautifulSoup的基本用法 35
2 4 XPath與lxml 37
2 4 1 XPath 37
2 4 2 lxml與XPath的使用 38
2 5 遍歷頁面 40
2 5 1 抓取下一個頁面 40
2 5 2 完成爬蟲 41
2 6 使用API 42
2 6 1 API簡介 42
2 6 2 API使用示例 44
第一章節實訓：嗶哩嗶哩直播間信息抓取練習 47
思考與練習 47
第3章數據存儲 48
3 1 Python中的文件 48
3 1 1 Python中的文件讀寫 48
3 1 2 對象序列化 50
3 2 Python中的字元串 50
3 3 Python中的圖片 51
3 3 1 PIL與Pillow模塊 51
3 3 2 Python與OpenCV簡介 53
3 4 CSV文件 54
3 4 1 CSV簡介 54
3 4 2 CSV的讀寫 54
3 5 資料庫的使用 56
3 5 1 MySQL的使用 56
3 5 2 SQLite 3的使用 57
3 5 3 SQLAlchemy的使用 58
3 5 4 Redis的使用 59
3 5 5 MongoDB的使用 60
3 6 其他類型的文檔 61
第一章節實訓：使用Python 3讀寫SQLite 3資料庫 63
思考與練習 64
進階篇
第4章 JavaScript與動態內容 65
4 1 JavaScript與AJAX技術 65
4 1 1 JavaScript語言 65
4 1 2 AJAX 68
4 2 抓取AJAX數據 69
4 2 1 分析數據 69
4 2 2 數據提取 72
4 3 抓取動態內容 76
4 3 1 動態渲染頁面 76
4 3 2 使用Selenium 76
4 3 3 PyV8與Splash 81
第一章節實訓：抓取人民郵電出版社熱銷圖書信息 83
思考與練習 84
第5章模擬登錄與驗證碼 85
5 1 表單 85
5 1 1 表單與POST 85
5 1 2 POST發送表單數據 87
5 2 Cookie 89
5 2 1 Cookie簡介 89
5 2 2 在Python中Cookie的使用 90
5 3 模擬登錄網站 91
5 3 1 分析網站 91
5 3 2 Cookie方法的模擬登錄 92
5 4 驗證碼 94
5 4 1 圖片驗證碼 94
5 4 2 滑動驗證 96
第一章節實訓：通過Selenium模擬登錄Gitee並保存Cookie 99
思考與練習 99
第6章爬蟲數據的分析與處理 100
6 1 Python與文本分析 100
6 1 1 文本分析簡介 100
6 1 2 jieba與SnowNLP 101
6 1 3 NLTK 104
6 1 4 文本分類與聚類 106
6 2 數據處理與科學計算 108
6 2 1 從MATLAB到Python 108
6 2 2 NumPy 108
6 2 3 Pandas 112
6 2 4 Matplotlib 116
6 2 5 Scipy與SymPy 118
第一章節實訓：美國新冠疫情每日新增人數的可視化 119
思考與練習 119
提高篇
第7章爬蟲的靈活性和多樣性 120
7 1 爬蟲的靈活性——以微信數據抓取為例 120
7 1 1 用Selenium抓取網頁版微信數據 120
7 1 2 基於Python的微信API工具 123
7 2 爬蟲的多樣性 125
7 2 1 在BeautifulSoup和XPath之外 125
7 2 2 在線爬蟲應用平台 127
7 2 3 使用urllib 129
7 3 爬蟲的部署和管理 134
7 3 1 使用伺服器部署爬蟲 134
7 3 2 本地爬蟲程序的編寫 137
7 3 3 爬蟲的部署 140
7 3 4 實時查看運行結果 141
7 3 5 使用框架管理爬蟲 142
第一章節實訓：基於PyQuery抓取菜鳥教程 144
思考與練習 145
第8章 Selenium模擬瀏覽器與網站測試 146
8 1 測試 146
8 1 1 什麼是測試 146
8 1 2 什麼是TDD 146
8 2 Python的單元測試 147
8 2 1 使用unittest 147
8 2 2 其他方法 149
8 3 使用Python網路爬蟲測試網站 150
8 4 使用Selenium測試 152
8 4 1 使用Selenium測試常用的網站交互 152
8 4 2 結合Selenium進行單元測試 153
第一章節實訓：使用Selenium抓取百度搜索引擎中關於「爬蟲」的結果 154
思考與練習 155
第9章爬蟲框架Scrapy與反爬蟲 156
9 1 爬蟲框架 156
9 1 1 Scrapy簡介 156
9 1 2 安裝與學習Scrapy 157
9 1 3 Scrapy爬蟲編寫 159
9 1 4 其他爬蟲框架介紹 161
9 2 網站反爬蟲 162
9 2 1 反爬蟲策略簡介 162
9 2 2 偽裝headers 163
9 2 3 代理IP的使用 165
9 2 4 控制訪問頻率 168
第一章節實訓：使用「反反爬蟲」策略抓取某日報網頭版的標題內容 168
思考與練習 169
實戰篇
第 10章實戰：保存感興趣的圖片 170
10 1 豆瓣網分析與爬蟲設計 170
10 1 1 從需求出發 170
10 1 2 處理登錄問題 171
10 2 編寫爬蟲程序 173
10 2 1 爬蟲腳本 173
10 2 2 程序分析 176
10 2 3 運行並查看結果 178
第 11章實戰：抓取二手房數據並繪製熱力圖 179
11 1 數據抓取 179
11 1 1 網頁分析 179
11 1 2 代碼編寫 181
11 1 3 運行並查看結果 183
11 2 繪製熱力圖 184
第 12章實戰：北京大興國際機場航班出發時間數據抓取 189
12 1 程序設計 189
12 1 1 網頁分析 189
12 1 2 將數據保存到資料庫 190
12 2 爬蟲編寫 191
12 2 1 前置準備 191
12 2 2 代碼編寫 192
12 2 3 運行並查看結果 195
參考文獻 196

詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於客服中心或Line或本社留言板留言，我們即儘速上架。

規格說明

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

Python網絡爬蟲-從入門到精通 (附微課) (本科) 呂雲翔 9787115611901 【台灣高等教育出版社】

商品介紹

規格說明

運送方式

相關商品