*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202407*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:大數據採集與預處理 ISBN:9787111757917 出版社:機械工業 著編譯者:李俊翰 武春嶺 頁數:259 所在地:中國大陸 *此為代購商品 書號:1670866 可大量預訂,請先連絡。 內容簡介 本書共分兩部分:第一部分是網路數據採集與預處理的基礎理論實踐,包括任務1∼任務6,主要講解如何使用Python編寫網路數據採集和預處理程序,內容包括Python環境搭建,Python基礎語法、語句與函數,網路基礎知識,常用網路數據採集與預處理庫、解析庫,數據持久化保存,以及requests庫、numpy庫、pandas庫、Selenium技術、ChromeDriver技術和Scrapy技術的應用方式。第二部分是網路數據採集與預處理的綜合案例,包括任務7∼任務9,主要講解requests庫數據採集與ECharts可視化技術相結合以展示數據,並持久化保存數據、預處理數據的應用案例;Selenium和ChromeDriver技術相結合模擬登錄,採集動態和靜態數據,並持久化保存數據和預處理數據的應用案例;Hadoop平台的Flume日誌數據採集應用案例,充分呈現了大數據採集與預處理主流技術、可視化技術的主要功能和特點。 本書可作為高等職業院校、職業本科院校大數據技術及相關專業的教材,也可作為有一定Python編程經驗並且對數據採集與預處理技術感興趣的工程技術人員的參考用書。目錄 前言第一部分 基礎理論實踐 任務1 Python環境搭建——編寫「Welcome to Python!」程序 1 1 任務描述 1 2 Python概述 1 3 Python編程環境搭建 1 3 1 在Windows環境下的安裝 1 3 2 在 Linux 環境下的安裝 1 3 3 在macOS環境下的安裝 1 4 安裝集成開發環境PyCharm 1 4 1 PyCharm概述 1 4 2 PyCharm的安裝和運行 1 5 Python基礎語法 1 5 1 整型 1 5 2 浮點型 1 5 3 字元串 1 5 4 列表 1 5 5 集合 1 5 6 字典 1 5 7 元組 1 6 Python語句與函數 1 6 1 條件判斷語句 1 6 2 循環語句 1 6 3 自定義函數 1 7 任務實現 1 8 小結 1 9 習題 任務2 實現簡單數據採集——採集業務網站頁面數據 2 1 任務描述 2 2 爬蟲基礎知識 2 2 1 網路爬蟲概述 2 2 2 爬蟲的法律和道德 2 2 3 Python爬蟲的工作過程 2 3 網路知識基礎 2 3 1 HTML 2 3 2 URI和URL 2 3 3 HTTP 2 3 4 Request和Response 2 4 requests庫 2 4 1 requests庫概述 2 4 2 requests庫安裝 2 4 3 requests庫的基本用法 2 5 lxml庫和BeautifulSoup庫 2 5 1 lxml庫概述 2 5 2 BeautifulSoup庫概述 2 5 3 lxml庫和BeautifulSoup庫安裝 2 5 4 lxml庫和BeautifulSoup庫的基本用法 2 6 任務實現 2 7 數據預處理基礎 2 7 1 數據預處理概述 2 7 2 數據清洗 2 7 3 數據集成 2 7 4 數據轉換 2 7 5 數據規約 2 7 6 數據預處理工具 2 8 小結 2 9 習題 任務3 存儲數據——學生就業信息數據讀寫和數據持久化 3 1 任務描述 3 2 MySQL 3 2 1 MySQL概述 3 2 2 MySQL安裝 3 2 3 MySQL Workbench的操作 3 3 PyMySQL 3 3 1 PyMySQL和MySQL的區別 3 3 2 PyMySQL安裝 3 3 3 PyMySQL的用法 3 4 CSV和JSON 3 4 1 CSV概述 3 4 2 輸出CSV文件頭部 3 4 3 使用Python讀取CSV文件數據 3 4 4 使用Python寫入CSV文件數據 3 4 5 JSON概述 3 4 6 使用Python讀取JSON文件數據 3 4 7 使用Python寫入JSON文件數據 3 5 任務實現 3 6 小結 3 7 習題 任務4 requests庫技術應用案例——靜態數據和動態數據採集 4 1 任務描述 4 2 靜態數據和動態數據 4 2 1 靜態數據基本概念 4 2 2 動態數據基本概念 4 2 3 AJAX的起源 4 2 4 AJAX概述 4 2 5 AJAX的特點 4 3 子任務1:業務網站A靜態數據採集 4 3 1 頁面分析 4 3 2 獲取靜態數據 4 3 3 數據持久化保存 4 3 4 網頁分頁爬取的翻頁操作實現 4 3 5 數據預處理 4 3 6 任務實現 4 4 子任務2:業務網站B靜態數據採集 4 4 1 頁面分析 4 4 2 獲取靜態數據 4 4 3 數據持久化保存 4 4 4 數據預處理 4 4 5 任務實現 4 5 子任務3:業務網站C動態數據採集 4 5 1 頁面分析 4 5 2 獲取動態數據 4 5 3 數據持久化保存 4 5 4 任務實現 4 6 子任務4:業務網站D靜態數據採集 4 6 1 業務網站D概述 4 6 2 業務網站D的基本用法 4 6 3 Web API概述 4 6 4 業務網站D開放API的數據特點 4 6 5 業務網站D的API請求數據 4 6 6 獲取API的響應數據 4 6 7 處理API的響應數據 4 6 8 任務實現 4 7 小結 4 8 習題 任務5 ChromeDriver和Selenium技術應用案例——網站數據採集 5 1 任務描述 5 2 ChromeDriver 5 2 1 ChromeDriver概述 5 2 2 ChromeDriver安裝 5 3 Selenium 5 3 1 Selenium概述 5 3 2 Selenium安裝 5 4 任務實現:業務網站數據採集 5 4 1 頁面分析 5 4 2 數據獲取 5 4 3 數據持久化保存 5 5 小結 5 6 習題 任務6 Scrapy技術應用案例——框架式數據採集 6 1 任務描述 6 2 Scrapy 6 2 1 Scrapy概述 6 2 2 Scrapy工作原理 6 2 3 Scrapy安裝 6 3 Scrapy組件 6 3 1 Selector 6 3 2 Spider 6 3 3 Downloader Middleware 6 3 4 Item Pipeline 6 4 任務實現:業務網站數據採集 6 4 1 頁面分析 6 4 2 數據獲取 6 4 3 數據持久化保存 6 5 小結 6 6 習題 第二部分 綜合案例 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |