內容簡介
本書主要介紹了如何確保企業所依賴的數據的質量。書中詳細闡述了自動化數據質量監控的重要性,並提供了實用的方法,幫助企業高效地覆蓋所有數據表,主動發現數據問題,並立即解決。作者們解釋了如何構建無監督機器學習模型來檢測數據問題,以及如何實施通知機制以減少警報疲勞,並迅速分類和解決這些問題。此外,本書還探討了如何將自動化數據質量監控與數據目錄
、BI和ML系統集成,以克服自動化監控的局限性,並在大規模環境中部署和管理監控解決方案。這本書是數據質量領域的實用指南,為企業提供了確保數據質量的有效策略和方法。作者簡介
傑里米·斯坦利(Jeremy Stanley)是Anomalo公司的聯合創始人兼首席技術官。此前,他曾在Instacart公司擔任數據科學副總裁,在那裡他領導了機器學習項目,並推動了旨在提高公司盈利能力的各項舉措。目錄
序目錄