PYTHON大數據分析 (美)Ivan Marin 9787512440715 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:北京航空航天大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$439
商品編號: 9787512440715
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202304*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:PYTHON大數據分析
ISBN:9787512440715
出版社:北京航空航天大學
著編譯者:(美)Ivan Marin
頁數:233
所在地:中國大陸 *此為代購商品
書號:1507937
可大量預訂,請先連絡。

內容簡介

這本書先介紹了如何使用Ppandas在Python中進行數據操作,教您熟悉統計分析和繪圖技術。還將通過多個實踐測試,讓您學會使用Dask分析分佈在多台計算機上的數據。接著還將為您介紹如何在內存無法容納全部數據時,為繪圖聚合數據。本書還將帶領您探索Hadoop(HDFS和YARN),它可幫助您處理更大的數據集。此外,這本書還介紹了Spark相關知識,並解釋了它如何與其他工具進行交互。 Python大數據分析是為Python開發人員、數據分析師和數據科學家設計的,他們需要親自動手控制數據並將其轉化為有影響力的見解。書中關於統計度量和關係資料庫的基本知識將幫助您理解在本書中的各種概念。

目錄

第1章 Python數據科學堆棧
1 1 概述
1 2 Python庫和軟體包
1 2 1 IPython:一個功能強大的互動式shell
1 2 2 Jupyter Notebook
1 2 3 使用IPython還是Jupyter
1 2 4 Numpy
1 2 5 Scipy
1 2 6 Matplotlib
1 2 7 Pandas
1 3 使用Pandas
1 3 1 讀取數據
1 3 2 數據操作
1 4 數據類型轉換
1 5 聚合和分組
1 6 從Pandas導出數據
1 7 Pandas可視化
1 8 總結
第2章 統計數據可視化
2 1 概述
2 2 可視化圖表
2 3 圖表的組件
2 4 Seaborn
2 5 圖的類型
2 5 1 折線圖(Line graph)
2 5 2 散點圖(Scatter plot)
2 5 3 直方圖(Histogram)
2 5 4 箱線圖(Boxplot)
2 6 Pandas DataFrame
2 7 修改圖的組件
2 7 1 配置軸對象的標題和標籤
2 7 2 修改線條顏色和樣式
2 7 3 修改圖的大小
2 8 導出圖像
2 9 總結
第3章 使用大數據框架
3 1 概述
3 2 Hadoop
3 2 1 使用HDFS操控數據
3 3 Spark數據處理平台
3 3 1 Spark SOL以及Pandas DataFrame
3 4 Parquet文件
3 4 1 編寫Parquet文件
3 4 2 使用Parquet和Partitions提高分析性能
3 5 處理非結構化數據
3 6 總結
第4章 Spark DataFrame
4 1 概述
4 2 使用Spark DataFrame使用方法
4 3 從Spark DataFrame中寫入輸出
4 4 探索和了解Spark DataFrame更多特點
4 5 使用Spark DataFrame對數據進行相關操作
4 6 Spark DataFrame繪製圖形
4 7 總結
第5章 處理缺失值以及相關性分析
5 1 概述
5 2 設置Jupyter Notebook
5 3 缺失值
5 4 處理Spark DataFrame中的缺失值
5 5 相關性
5 6 總結
第6章 進行探索性數據分析
6 1 概述
6 2 定義商業問題
6 2 1 問題識別
6 2 2 需求收集
6 2 3 數據管道和工作流
6 2 4 識別可測量的指標
6 2 5 文檔和展示
6 3 將商業問題轉化為可測量的度量標準和進行探索性數據分析(Exploratory Data Analysis, EDA)
6 3 1 數據採集
6 3 2 數據生成分析
6 3 3 KPI可視化
6 3 4 特徵重要性
6 4 數據科學項目生命周期的結構化方法
6 4 1 第一階段:理解和定義業務問題
6 4 2 第二階段:數據訪問與發現
6 4 3 第三階段:數據工程和預處理
6 4 4 第四階段:模型開發
6 5 總結
第7章 大數據分析中的再現性
7 1 概述
7 2 Jupyter Notebooks的再現性
7 2 1 業務問題介紹
7 2 2 記錄方法和工作流程
7 2 3 數據管道
7 2 4 相關性
7 2 5 使用源代碼版本控制
7 2 6 模塊化過程
7 3 以可複製的方式收集數據
7 3 1 標記單元格和代碼單元格中的功能
7 3 2 解釋標記語言中的業務問題
7 3 3 提供數據源的詳細介紹
7 3 4 解釋標記中的數據屬性
7 4 進行編碼實踐和標準編寫
7 4 1 環境文件
7 4 2 編寫帶有註釋的可讀代碼
7 4 3 工作流程的有效分割
7 4 4 工作流文檔
7 5 避免重複
7 5 1 使用函數和循環優化代碼
7 5 2 為代碼/演算法重用開發庫/包
7 6 總結
第8章 創建完整的分析報告
8 1 概述
8 2 Spark可從不同的數據源讀取數據
8 3 在Spark DataFrame上進行SQL操作
8 4 生成統計測量值
8 5 總結
附錄

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理