SQL數據分析 凱西.谷村 9787519879518 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:中國電力
NT$814
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202308*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:SQL數據分析
ISBN:9787519879518
出版社:中國電力
著編譯者:凱西.谷村
頁數:370
所在地:中國大陸 *此為代購商品
書號:1576895
可大量預訂,請先連絡。

內容簡介

隨著數據、算力和雲數據倉庫的激增,對於有經驗的分析師或數據科學家來說,SQL已經成為一個更加不可或缺的工具。本書展示了提高SQL技能、解決問題,以及在工作流程中充分利用SQL新的和隱藏的方法。 你將學習如何以創新的方式使用常用的和特殊的SQL函數(如連接、窗口函數、子查詢和正則表達式),以及如何用可理解的代碼,通過組合SQL技術更快地完成目標。如果你在平常工作中也會用到SQL資料庫,本書會是必備的參考資料。

作者簡介

凱西·谷村,熱衷於將人們和組織與他們需要的數據聯繫起來,以產生價值和影響。20多年來,她一直在分析各種行業的數據,從金融到B2B軟體,再到消費者服務。她有在大多數主流的專有和開源資料庫中使用SQL分析數據的經驗。她在多家領先的科技公司建立並管理數據團隊和數據基礎設施。Cathy還經常在頂級會議上發表演講,主題包括構建數據文化、數據驅動產品開發和包容性數據分析。

目錄

前言
第1章 用SQL來做數據分析
1 1 什麼是數據分析
1 2 為什麼用SQL
1 2 1 SQL是什麼
1 2 2 SQL的優勢
1 2 3 SQL與R和Python的對比
1 2 4 SQL作為數據分析流程中的一部分
1 3 資料庫類型以及如何使用
1 3 1 行存儲數據
1 3 2 列存儲數據
1 3 3 其他的數據結構類型
1 4 總結
第2章 為數據分析做準備
2 1 數據類型
2 1 1 資料庫的數據類型
2 1 2 結構化和非結構化數據
2 1 3 定量和定性數據
2 1 4 第一方、第二方和第三方數據
2 1 5 稀疏數據
2 2 SQL查詢結構
2 3 數據剖析:分佈
2 3 1 直方圖和頻率
2 3 2 分箱
2 3 3 n-Tiles
2 4 數據剖析:數據質量
2 4 1 檢測重複數據
2 4 2 用GROUP BY和DISTINCT來處理重複數據
2 5 準備:數據清理
2 5 1 通過CASE轉換來清理數據
2 5 2 數據類型轉換
2 5 3 處理空值:coalesce,nulliff,nvl函數
2 5 4 缺失的數據
2 6 準備:數據構形
2 6 1 你需要怎樣的輸出:BI,可視化,統計,機器學習
2 6 2 用CASE語句進行數據透視
2 6 3 用UNION語句來取消數據透視
2 6 4 pivot(透視)和 unpivot(取消透視)函數
2 7 總結
第3章 時間序列分析
3 1 日期、日期時間和時間操作
3 1 1 時區轉換
3 1 2 日期和時間戳的格式轉換
3 1 3 日期相關的計算
3 1 4 時間相關的計算
3 1 5 連接不同來源的數據
3 2 零售銷售數據集
3 3 對數據進行趨勢分析
3 3 1 簡單的趨勢
3 3 2 比較時間序列的組成部分
3 3 3 計算佔總數的百分比
3 3 4 運用索引以查看隨時間變化的百分比
3 4 滾動時間窗口
3 4 1 計算滾動時間窗口
3 4 2 稀疏數據的滾動時間窗口
3 4 3 計算累計值
3 5 季節性分析
3 5 1 同期比較:YoY和MoM
3 5 2 同期比較:與去年的同月進行對比
3 5 3 與多個以前的周期做對比
3 6 總結
第4章 同期群分析
4 1 同期群:一種有用的分析框架
4 2 立法者數據集
4 3 留存
4 3 1 基本留存曲線的SQL
4 3 2 調整時間序列以提高留存率的準確性
4 3 3 從時間序列數據構建同期群
4 3 4 從單獨的表構建同期群
4 3 5 處理稀疏同期群
4 3 6 用除第一個日期以外的其他日期定義同期群
4 4 相關同期群分析
4 4 1 生存
4 4 2 返回或重複購買行為
4 4 3 累積計算
4 5 透過同期群看橫斷面分析
4 6 總結
第5章 文本分析
5 1 為什麼使用SQL進行文本分析
5 1 1 什麼是文本分析
5 1 2 為什麼SQL是文本分析的好選擇
5 1 3 什麼情況下SQL不是一個好的選擇
5 2 UFO目擊數據集
5 3 文本特徵
5 4 解析文本
5 5 文本轉換
5 6 在較大的文本塊中查找元素
5 6 1 通配符匹配:LIKE,ILIKE
5 6 2 精確匹配:IN,NOTIN
5 6 3 正則表達式
5 7 構建與重塑文本
5 7 1 拼接
5 7 2 重塑文本
5 8 總結
第6章 異常檢測
6 1 SQL異常檢測的能力和限制
6 2 數據集
6 3 檢測異常值
6 3 1 通過排序查找異常
6 3 2 通過計算百分比和標準偏差發現異常
6 3 3 通過作圖可視化查找異常
6 4 異常的形式
6 4 1 異常值
6 4 2 異常的計數或頻率
6 4 3 數據缺失引起的異常
6 5 處理異常
6 5 1 探查
6 5 2 刪除
6 5 3 替代值替換
6 5 4 縮放
6 6 總結
第7章 實驗分析
7 1 用SQL進行實驗分析的優勢與局限性
7 2 數據集
7 3 實驗的類型
7 3 1 二元結果實驗:卡方檢驗
7 3 2 具有連續結果的實驗:t檢驗
7 4 實驗的挑戰和拯救有缺陷的實驗的方法
7 4 1 變體分配
7 4 2 異常值
7 4 3 時間盒
7 4 4 重複暴露實驗
7 5 當無法進行控制實驗時:替代分析
7 5 1 前/後分析
7 5 2 自然實驗分析
7 5 3 閾值附近的群體分析
7 6 總結
第8章 創建用於分析的複雜數據集
8 1 何時對複雜數據集使用SQL
8 1 1 使用SQL的優點
8 1 2 什麼時候構建ETL
8 1 3 何時將邏輯放入其他工具中
8 2 代碼組織
8 2 1 註釋
8 2 2 大寫,縮進,括弧和其他格式技巧
8 2 3 存儲代碼
8 3 組織計算
8 3 1 理解SQL子句的計算順序
8 3 2 子查詢
8 3 3 臨時表
8 3 4 公共表表達式
8 3 5 grouping sets
8 4 管理數據集大小和隱私問題
8 4 1 使用%、mod進行抽樣
8 4 2 降低維數
8 4 3 PII和數據隱私
8 5 總結
第9章 結論
9 1 漏斗分析
9 2 流失、中止和其他離開的定義
9 3 購物籃
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理