*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202404*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:機器學習大數據平臺的構建.任務實現與數據治理-使用Azure.DevOps.MLOps ISBN:9787302657637 出版社:清華大學 著編譯者:弗拉德.里斯庫蒂亞 頁數:288 所在地:中國大陸 *此為代購商品 書號:1638107 可大量預訂,請先連絡。 【台灣高等教育出版社簡體書】 機器學習大數據平臺的構建.任務實現與數據治理-使用Azure.DevOps.MLOps 787302657637 弗拉德.里斯庫蒂亞 內容簡介 你需要構建安全、穩定的數據平台,需要可以擴展到任何規模的工作負載。當項目從實驗室進入生產環境時,你需要確信它可以應對現實工作中的挑戰。本書能夠幫助你實現這些需求,將講述如何設計和實現基於雲的、可以輕鬆監控、擴展和修改的數據基礎設施。 通過本書,你將學到構建和維護大型企業大數據平台所需的技能。書中包括設置基礎設施、編排、工作負載和治理,寫作風格清晰、實用。在學習過程中,你將建立高效的機器學習管道,然後掌握省時的自動化和DevOps解決方案。書中基於Azure的示例很容易在其他雲平台上實現。 主要內容: 數據字典和數據治理; 數據質量管控、合規和分發; 構建自動化管道以提高可靠性; 數據攝取、存儲和分發; 支持生產環境中的數據建模、分析和機器學習。 讀者對象: 本書面向數據工程師,講述如何使用雲計算和DevOps進行數據工程。作者簡介 葉偉民,廣州 NET技術俱樂部主席、中國香港Azure/ NET技術俱樂部創始人兼主席、 NET社區聯盟建設者,在 NET編程領域有15年工作經驗。目錄 第1章 簡介1 1 什麼是數據工程 1 2 本書讀者對象 1 3 什麼是數據平台 1 3 1 數據平台的構成 1 3 2 基礎設施即代碼,無代碼基礎設施 1 4 使用雲構建 1 4 1 IaaS、PaaS和SaaS 1 4 2 網路、存儲和計算 1 4 3 如何使用Azure 1 4 4 與Azure交互 1 5 實現Azure數據平台 1 6 本章小結 第Ⅰ部分 基礎設施 第2章 存儲 2 1 在數據平台中存儲數據 2 1 1 跨多個數據織物存儲數據 2 1 2 SSOT 2 2 Azure Data Explorer簡介 2 2 1 部署Azure Data Explorer集群 2 2 2 使用Azure Data Explorer 2 2 3 解決查詢限制問題 2 3 Azure Data Lake Storage簡介 2 3 1 創建Azure Data Lake Storage賬戶 2 3 2 使用Azure Data Lake Storage 2 3 3 集成Azure Data Explorer 2 4 數據攝取 2 4 1 數據攝取頻率 2 4 2 載入類型 2 4 3 數據重建和重新載入 2 5 本章小結 第3章 DevOps 3 1 什麼是DevOps 3 2 Azure DevOps簡介 3 3 部署基礎設施 3 3 1 導出Azure Resource Manager模板 3 3 2 創建Azure DevOps服務連接 3 3 3 部署Azure Resource Manager模板 3 3 4 理解Azure Pipelines 3 4 部署Azure Data Explorer對象和分析 3 4 1 使用Azure DevOps市場擴展 3 4 2 將所有內容都存儲在Git並自動部署所有內容 3 5 本章小結 第4章 編排 4 1 導入Bing COVID-19開放數據集 4 2 Azure Data Factory簡介 4 2 1 設置數據源 4 2 2 設置數據接收器 4 2 3 設置管道 4 2 4 設置觸發器 4 2 5 使用Azure Data Factory進行編排 4 3 Azure Data Factory的DevOps 4 3 1 從Git部署Azure Data Factory 4 3 2 設置訪問控制 4 3 3 部署生產環境的Azure Data Factory 4 3 4 小結 4 4 使用Azure Monitor進行監控 4 5 本章小結 第Ⅱ部分 具體的工作任務 第5章 數據處理 5 1 數據建模技術 5 1 1 規範化和反規範化 5 1 2 數據倉庫 5 1 3 半結構化數據 5 1 4 小結 5 2 身份鑰匙環 5 2 1 構建身份鑰匙環 5 2 2 理解鑰匙環 5 3 時間線 5 3 1 構建時間線視圖 5 3 2 使用時間線 5 4 應用DevOps以保證數據處理能夠按計劃可靠地運行 5 4 1 使用Git追蹤和處理函數 5 4 2 使用Azure Data Factory構建鑰匙環 5 4 3 擴展規模 5 5 本章小結 第6章 數據分析 6 1 開發環境和生產環境分離下如何訪問數據 6 1 1 對生產數據處理后再部分複製到開發環境 6 1 2 將生產數據完全複製到開發環境 6 1 3 在開發環境中提供生產數據的只讀視圖 6 1 4 小結 6 2 設計數據分析的工作流程 6 2 1 原型 6 2 2 開發和用戶驗收測試 6 2 3 生產環境 6 2 4 小結 6 3 讓數據科學家能夠自助移動數據 6 3 1 基本原則和相關背景 6 3 2 數據合約 6 3 3 管道驗證 6 3 4 事後分析 6 3 5 小結 6 4 本章小結 第7章 機器學習 7 1 訓練一個機器學習模型 7 1 1 使用scikit-learn訓練模型 7 1 2 高消費者模型實現 7 2 引入Azure Machine Learning 7 2 1 創建工作區 7 2 2 創建Azure Machine Learning計算目標 7 2 3 設置Azure Machine Learning存儲 7 2 4 在雲中運行機器學習 7 2 5 小結 7 3 MLOps 7 3 1 從Git部署 7 3 2 存儲管道ID 7 3 3 小結 7 4 機器學習的編排 7 4 1 連接Azure Data Factory與Azure Machine Learning 7 4 2 機器學習編排 7 4 3 小結 7 5 本章小結 第Ⅲ部分 數據治理 第8章 元數據 8 1 理解大數據平台中元數據的需求 8 2 介紹Azure Purview 8 3 維護數據字典 8 3 1 設置掃描 8 3 2 瀏覽數據字典 8 3 3 小結 8 4 管理數據術語表 8 4 1 添加新的術語 8 4 2 審查術語 8 4 3 自定義模板和批量導入 8 4 4 小結 8 5 了解Azure Purview的高級功能 8 5 1 追蹤數據血緣 8 5 2 分類規則 8 5 3 REST API 8 5 4 小結 8 6 本章小結 第9章 數據質量 9 1 數據測試概述 9 1 1 可用性測試 9 1 2 正確性測試 9 1 3 完整性測試 9 1 4 異常檢測測試 9 1 5 小結 9 2 使用Azure Data Factor 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |