*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202404*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:數據採集與處理-基於Python ISBN:9787300325682 出版社:中國人民大學 著編譯者:付東普 頁數:273 所在地:中國大陸 *此為代購商品 書號:1630057 可大量預訂,請先連絡。 內容簡介 本書從Python語言的基本特性入手,詳細介紹了各類數據編碼和存取技術、網路爬蟲相關技術、數據預處理和數據可視化技術等,內容覆蓋本地文件、網路數據、大數據訪問及數據預處理等編程中的主要知識和技術,在重視理論基礎的前提下,從實用性和豐富度出發,結合實例演示了數據採集、處理與存儲的核心流程。 本書可作為高等院校數據科學與大數據技術、計算機科學與技術、軟體工程等專業的本科教材,也適合Python語言初學者、網路爬蟲技術愛好者、數據分析從業人士閱讀。作者簡介 付東普,管理學博士,產業經濟學博士后,首都經濟貿易大學信息學院副教授,主要關注互聯網金融及電子商務領域研究。 1992-1996年就讀於合肥工業大學材料科學與工程系,獲本科工學學士學位;2005-2007年就讀於北京理工大學軟體學院,獲軟體工程碩士學位;2011-2014年就讀於中國人民大學商學院,獲管理學博士學位;2015-2017年在北京交通大學中國產業安全研究中心博士后科研工作站從事應用經濟學博士后研究。 曾從事十余年的軟體系統設計、開發和管理工作,後於2011年轉入學術理論研究,在國內外學術會議和期刊上發表了二十余篇學術論文,並出版專著兩部。目錄 第一章 概述第一節 數據科學概述 第二節 數據採集概述 第三節 數據存儲概述 第四節 Python相關數據科學工具 思考與練習 延伸閱讀材料 第二章 Python基礎 第一節 Python簡介 第二節 Python基本語法與命令 第三節 運算符、表達式與內置對象 第四節 函數 第五節 異常及其處理 思考與練習 延伸閱讀材料 第三章 numpy與pandas基礎 第一節 numpy基礎 第二節 pandas基礎 思考與練習 延伸閱讀材料 第四章 數據可視化 第一節 數據可視化概述 第二節 matplotlib繪圖工具 第三節 其他數據可視化工具 思考與練習 延伸閱讀材料 第五章 文件讀寫與操作 第一節 文件讀寫基本操作 第二節 CSV文件讀寫 第三節 XML文件讀寫 第四節 JSON文件讀寫 第五節 HDF文件讀寫 第六節 Office文件讀寫 第七節 PDF文件讀寫 第八節 圖像文件讀寫 思考與練習 延伸閱讀材料 第六章 統計與概率基礎 第一節 統計基礎 第二節 概率與分佈 思考與練習 延伸閱讀材料 第七章 數據清洗與預處理 第一節 數據清洗 第二節 數據整合 第三節 數據變換 第四節 聚合與分組統計 第五節 數據歸約 思考與練習 延伸閱讀材料 第八章 網路數據採集 第一節 爬蟲的相關概念與知識 第二節 HTML與基礎 第三節 靜態網頁內容爬取與解析 第四節 動態網頁內容爬取 第五節 爬蟲框架Scrapy與應用 思考與練習 延伸閱讀材料 第九章 關係型資料庫連接與訪問 第一節 關係型資料庫概述 第二節 SQLite資料庫連接與訪問 第三節 MySQL資料庫連接與訪問 思考與練習 延伸閱讀材料 第十章 大數據存儲與訪問技術 第一節 大數據技術 第二節 非關係型資料庫簡介 第三節 MongoDB資料庫連接與訪問 思考與練習 延伸閱讀材料 第十一章 數據集成與ETL技術 第一節 數據集成 第二節 ETL相關技術與工具 思考與練習 延伸閱讀材料 參考文獻 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |