AI輔助數據質量監控 傑里米.斯坦利 佩奇.施瓦茨 9787111780250 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$502
商品編號: 9787111780250
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202506*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:AI輔助數據質量監控
ISBN:9787111780250
出版社:機械工業
著編譯者:傑里米.斯坦利 佩奇.施瓦茨
頁數:202
所在地:中國大陸 *此為代購商品
書號:1737048
可大量預訂,請先連絡。

內容簡介

本書主要介紹了如何確保企業所依賴的數據的質量。書中詳細闡述了自動化數據質量監控的重要性,並提供了實用的方法,幫助企業高效地覆蓋所有數據表,主動發現數據問題,並立即解決。作者們解釋了如何構建無監督機器學習模型來檢測數據問題,以及如何實施通知機制以減少警報疲勞,並迅速分類和解決這些問題。此外,本書還探討了如何將自動化數據質量監控與數據

目錄

、BI和ML系統集成,以克服自動化監控的局限性,並在大規模環境中部署和管理監控解決方案。這本書是數據質量領域的實用指南,為企業提供了確保數據質量的有效策略和方法。

作者簡介

傑里米·斯坦利(Jeremy Stanley)是Anomalo公司的聯合創始人兼首席技術官。此前,他曾在Instacart公司擔任數據科學副總裁,在那裡他領導了機器學習項目,並推動了旨在提高公司盈利能力的各項舉措。

目錄


前言
第1章 數據質量監控勢在必行
1 1 高質量的數據是新時代的黃金
1 1 1 數據驅動型公司是當今的顛覆者
1 1 2 數據分析的普及
1 1 3 人工智能和機器學習是競爭優勢之源
1 1 4 公司正在投資現代數據棧
1 2 數據越多,問題越多
1 2 1 數據工廠中的問題
1 2 2 數據遷移
1 2 3 第三方數據源
1 2 4 公司的成長與變化
1 2 5 外界因素
1 3 為什麼我們需要數據質量監控
1 3 1 數據疤痕
1 3 2 數據衝擊
1 4 自動化數據質量監控:一個全新的領域
第2章 數據質量監控策略與自動化的角色
2 1 監控需求
2 2 數據可觀測性:必要但不充分
2 3 傳統的數據質量監控方法
2 3 1 人工數據質量檢測
2 3 2 基於規則的測試
2 3 3 指標監控
2 4 使用無監督機器學習實現自動化數據質量監控
2 4 1 什麼是無監督機器學習
2 4 2 類比:車道偏離警告
2 4 3 自動化的局限性
2 5 數據質量監控的四大支柱方法
第3章 對自動化數據質量監控的商業影響進行評估
3 1 對數據進行評估
3 1 1 數量
3 1 2 種類
3 1 3 速度
3 1 4 真實性
3 1 5 特殊情況
3 2 評估你的行業
3 2 1 監管壓力
3 2 2 人工智能/機器學習的風險
3 2 3 數據即產品
3 3 評估你的數據成熟度
3 4 評估對利益相關方的好處
3 4 1 工程師
3 4 2 數據團隊領導者
3 4 3 科學家
3 4 4 消費者
3 5 進行投資回報率分析
3 5 1 定量指標
3 5 2 定性指標
3 6 總結
第4章 利用機器學習使數據質量監控自動化
4 1 要求
4 1 1 敏感性
4 1 2 特異性
4 1 3 透明度
4 1 4 可擴展性
4 1 5 非必要需求
4 1 6 數據質量監控不等同於異常檢測
4 2 機器學習方法和算法
4 2 1 數據抽樣
4 2 2 特徵編碼
4 2 3 模型開發
4 2 4 模型可解釋性
4 3 整體思路的偽代碼實現
4 4 其他應用
4 5 總結
第5章 構建一個適用於真實數據的模型
5 1 數據挑戰及應對措施
5 1 1 季節性
5 1 2 基於時間的特徵
5 1 3 混亂程度
5 1 4 就地更新表格
5 1 5 列之間的相關性
5 2 模型測試
5 2 1 引入合成異常
5 2 2 基準測試
5 2 3 模型改進
5 3 總結
第6章 實施警報機制同時避免警報疲勞
6 1 如何通過通知促進數據問題響應
6 1 1 分類處理
6 1 2 路由
6 1 3 解決方案
6 1 4 文檔記錄
6 2 在沒有通知的情況下採取行動
6 3 一個通知的解析
6 3 1 可視化
6 3 2 操作
6 3 3 文本描述
6 3 4 檢查的創建者/最後編輯者
6 4 發送通知
6 4 1 通知的受眾
6 4 2 通知的渠道
6 4 3 通知的時機
6 5 避免警報疲勞
6 5 1 合理安排檢查順序
6 5 2 使用機器學習對警報進行聚類
6 5 3 抑制通知
6 6 自動化根因分析
6 7 總結
第7章 集成監控與數據工具和系統
7 1 監控數據堆棧
7 2 數據倉庫
7 2 1 與數據倉庫集成
7 2 2 安全性
7 2 3 多倉庫之間的數據協調
7 3 數據編排器
7 4 數據

目錄


7 5 數據使用者
7 5 1 BI和分析工具
7 5 2 MLOps
7 6 總結
第8章 大規模運營解決方案
8 1 自建還是購買
8 2 配置
8 2 1 確定最重要的表格
8 2 2 決定監控表格中的哪些數據
8 2 3 大規模配置
8 3 啟用
8 3 1 用戶角色和許可權
8 3 2 培訓、支持與推廣
8 4 持續改善數據質量
8 4 1 數據健康計劃
8 4 2 衡量指標
8 5 從混亂到清晰
附錄 數據質量問題的類型

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理