| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202308*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:SQL數據分析 ISBN:9787519879518 出版社:中國電力 著編譯者:凱西.谷村 頁數:370 所在地:中國大陸 *此為代購商品 書號:1576895 可大量預訂,請先連絡。 內容簡介 隨著數據、算力和雲數據倉庫的激增,對於有經驗的分析師或數據科學家來說,SQL已經成為一個更加不可或缺的工具。本書展示了提高SQL技能、解決問題,以及在工作流程中充分利用SQL新的和隱藏的方法。 你將學習如何以創新的方式使用常用的和特殊的SQL函數(如連接、窗口函數、子查詢和正則表達式),以及如何用可理解的代碼,通過組合SQL技術更快地完成目標。如果你在平常工作中也會用到SQL資料庫,本書會是必備的參考資料。作者簡介 凱西·谷村,熱衷於將人們和組織與他們需要的數據聯繫起來,以產生價值和影響。20多年來,她一直在分析各種行業的數據,從金融到B2B軟體,再到消費者服務。她有在大多數主流的專有和開源資料庫中使用SQL分析數據的經驗。她在多家領先的科技公司建立並管理數據團隊和數據基礎設施。Cathy還經常在頂級會議上發表演講,主題包括構建數據文化、數據驅動產品開發和包容性數據分析。目錄 前言第1章 用SQL來做數據分析 1 1 什麼是數據分析 1 2 為什麼用SQL 1 2 1 SQL是什麼 1 2 2 SQL的優勢 1 2 3 SQL與R和Python的對比 1 2 4 SQL作為數據分析流程中的一部分 1 3 資料庫類型以及如何使用 1 3 1 行存儲數據 1 3 2 列存儲數據 1 3 3 其他的數據結構類型 1 4 總結 第2章 為數據分析做準備 2 1 數據類型 2 1 1 資料庫的數據類型 2 1 2 結構化和非結構化數據 2 1 3 定量和定性數據 2 1 4 第一方、第二方和第三方數據 2 1 5 稀疏數據 2 2 SQL查詢結構 2 3 數據剖析:分佈 2 3 1 直方圖和頻率 2 3 2 分箱 2 3 3 n-Tiles 2 4 數據剖析:數據質量 2 4 1 檢測重複數據 2 4 2 用GROUP BY和DISTINCT來處理重複數據 2 5 準備:數據清理 2 5 1 通過CASE轉換來清理數據 2 5 2 數據類型轉換 2 5 3 處理空值:coalesce,nulliff,nvl函數 2 5 4 缺失的數據 2 6 準備:數據構形 2 6 1 你需要怎樣的輸出:BI,可視化,統計,機器學習 2 6 2 用CASE語句進行數據透視 2 6 3 用UNION語句來取消數據透視 2 6 4 pivot(透視)和 unpivot(取消透視)函數 2 7 總結 第3章 時間序列分析 3 1 日期、日期時間和時間操作 3 1 1 時區轉換 3 1 2 日期和時間戳的格式轉換 3 1 3 日期相關的計算 3 1 4 時間相關的計算 3 1 5 連接不同來源的數據 3 2 零售銷售數據集 3 3 對數據進行趨勢分析 3 3 1 簡單的趨勢 3 3 2 比較時間序列的組成部分 3 3 3 計算佔總數的百分比 3 3 4 運用索引以查看隨時間變化的百分比 3 4 滾動時間窗口 3 4 1 計算滾動時間窗口 3 4 2 稀疏數據的滾動時間窗口 3 4 3 計算累計值 3 5 季節性分析 3 5 1 同期比較:YoY和MoM 3 5 2 同期比較:與去年的同月進行對比 3 5 3 與多個以前的周期做對比 3 6 總結 第4章 同期群分析 4 1 同期群:一種有用的分析框架 4 2 立法者數據集 4 3 留存 4 3 1 基本留存曲線的SQL 4 3 2 調整時間序列以提高留存率的準確性 4 3 3 從時間序列數據構建同期群 4 3 4 從單獨的表構建同期群 4 3 5 處理稀疏同期群 4 3 6 用除第一個日期以外的其他日期定義同期群 4 4 相關同期群分析 4 4 1 生存 4 4 2 返回或重複購買行為 4 4 3 累積計算 4 5 透過同期群看橫斷面分析 4 6 總結 第5章 文本分析 5 1 為什麼使用SQL進行文本分析 5 1 1 什麼是文本分析 5 1 2 為什麼SQL是文本分析的好選擇 5 1 3 什麼情況下SQL不是一個好的選擇 5 2 UFO目擊數據集 5 3 文本特徵 5 4 解析文本 5 5 文本轉換 5 6 在較大的文本塊中查找元素 5 6 1 通配符匹配:LIKE,ILIKE 5 6 2 精確匹配:IN,NOTIN 5 6 3 正則表達式 5 7 構建與重塑文本 5 7 1 拼接 5 7 2 重塑文本 5 8 總結 第6章 異常檢測 6 1 SQL異常檢測的能力和限制 6 2 數據集 6 3 檢測異常值 6 3 1 通過排序查找異常 6 3 2 通過計算百分比和標準偏差發現異常 6 3 3 通過作圖可視化查找異常 6 4 異常的形式 6 4 1 異常值 6 4 2 異常的計數或頻率 6 4 3 數據缺失引起的異常 6 5 處理異常 6 5 1 探查 6 5 2 刪除 6 5 3 替代值替換 6 5 4 縮放 6 6 總結 第7章 實驗分析 7 1 用SQL進行實驗分析的優勢與局限性 7 2 數據集 7 3 實驗的類型 7 3 1 二元結果實驗:卡方檢驗 7 3 2 具有連續結果的實驗:t檢驗 7 4 實驗的挑戰和拯救有缺陷的實驗的方法 7 4 1 變體分配 7 4 2 異常值 7 4 3 時間盒 7 4 4 重複暴露實驗 7 5 當無法進行控制實驗時:替代分析 7 5 1 前/後分析 7 5 2 自然實驗分析 7 5 3 閾值附近的群體分析 7 6 總結 第8章 創建用於分析的複雜數據集 8 1 何時對複雜數據集使用SQL 8 1 1 使用SQL的優點 8 1 2 什麼時候構建ETL 8 1 3 何時將邏輯放入其他工具中 8 2 代碼組織 8 2 1 註釋 8 2 2 大寫,縮進,括弧和其他格式技巧 8 2 3 存儲代碼 8 3 組織計算 8 3 1 理解SQL子句的計算順序 8 3 2 子查詢 8 3 3 臨時表 8 3 4 公共表表達式 8 3 5 grouping sets 8 4 管理數據集大小和隱私問題 8 4 1 使用%、mod進行抽樣 8 4 2 降低維數 8 4 3 PII和數據隱私 8 5 總結 第9章 結論 9 1 漏斗分析 9 2 流失、中止和其他離開的定義 9 3 購物籃 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |