*數量非實際在台庫存 *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為實際資訊。 印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:機器學習系統設計 ISBN:9787519886288 出版社:中國電力 著編譯者:奇普.胡岩 頁數:361 所在地:中國大陸 *此為代購商品 書號:1619511 可大量預訂,請先連絡。 內容簡介 機器學習系統既複雜又獨特。複雜是因為它們由許多不同的部分組成且涉及很多不同的利益相關者。獨特是因為機器學習系統依賴於數據,不同應用場景的數據差異很大。在這本書中,你將學習一種整體方法來設計可靠、可擴展、可維護,並且能適應不斷變化的環境和業務需求的機器學習系統。 本書作者Chip Huyen(Claypot AI的聯合創始人)從達成系統整體目標的角度出發,考慮了包括處理和創建訓練數據、特徵選擇、重新訓練模型的頻率以及監控哪些指標在內的每一個設計決策。本書中的迭代框架是在擁有大量文獻支持的真實案例之上構建的。 本書可以在以下場景中為你提供幫助: 數據工程及選擇正確的指標來解決業務問題。 自動化持續開發、評估、部署和更新模型的過程。 開發用於快速檢測和解決模型在生產中問題的監控系統。 構建支持多應用場景的機器學習平台。 開發負責任的機器學習系統。作者簡介 奇普·胡岩(Chip Huyen)是實時機器學習平台Claypot AI的聯合創始人。在NVIDIA、Netflix和Snorkel AI工作期間,她幫助多家大型機構開發和部署了機器學習系統。這本書是基於她在斯坦福大學教授的機器學習系統設計課程(CS 239S)撰寫的。目錄 前言第1章 機器學習系統概述 1 1 何時使用機器學習 1 2 理解機器學習系統 1 2 1 科研中的機器學習與生產中的機器學習 1 2 2 機器學習系統與傳統軟體 1 3 本章小結 第2章 機器學習系統設計簡介 2 1 業務目標和機器學習目標 2 2 機器學習系統需要滿足的要求 2 2 1 可靠性 2 2 2 可擴展性 2 2 3 可維護性 2 2 4 適應性 2 3 迭代過程 2 4 構造機器學習問題 2 4 1 機器學習任務分類 2 4 2 目標函數 2 5 思維與數據 2 6 本章小結 第3章 數據工程基礎 3 1 數據源 3 2 數據格式 3 2 1 JSON 3 2 2 行優先格式與列優先格式 3 2 3 文本格式與二進位格式 3 3 數據模型 3 3 1 關係模型 3 3 2 NoSQL 3 3 3 結構化數據和非結構化數據 3 4 數據存儲引擎和處理方式 3 4 1 事務處理和分析處理 3 4 2 ETL:數據的提取、轉換和載入 3 5 數據流的模式 3 5 1 通過資料庫傳遞數據 3 5 2 通過服務傳遞數據 3 5 3 通過實時傳輸服務傳遞數據 3 6 批處理與流處理 3 7 本章小結 第4章 訓練數據 4 1 數據抽樣 4 1 1 非概率抽樣 4 1 2 簡單隨機抽樣 4 1 3 分層抽樣 4 1 4 加權抽樣 4 1 5 蓄水池抽樣 4 1 6 重要性抽樣 4 2 數據標註 4 2 1 人工標註 4 2 2 自然標籤 4 2 3 處理標籤缺失 4 3 類別不均衡 4 3 1 類別不均衡帶來的挑戰 4 3 2 處理類別不均衡問題 4 4 數據增強 4 4 1 簡單的標籤保留變換 4 4 2 擾動 4 4 3 數據合成 4 5 本章小結 第5章 特徵工程 5 1 學習得到的特徵與特徵工程得到的特徵 5 2 常見特徵工程操作 5 2 1 缺失值處理 5 2 2 特徵縮放 5 2 3 特徵離散化 5 2 4 編碼分類特徵 5 2 5 特徵交叉 5 2 6 離散位置嵌入和連續位置嵌入 5 3 數據泄漏 5 3 1 數據泄漏的常見原因 5 3 2 數據泄漏的檢測 5 4 構建好的特徵 5 4 1 特徵的重要性 5 4 2 特徵泛化 5 5 本章小結 第6章 模型開發和離線評估 6 1 模型開發與訓練 6 1 1 評估機器學習模型 6 1 2 模型集成 6 1 3 實驗跟蹤和版本控制 6 1 4 分散式訓練 6 1 5 自動機器學習 6 2 模型離線評估 6 2 1 基線 6 2 2 評估方法 6 3 本章小結 第7章 模型部署和預測服務 7 1 機器學習部署誤區 7 1 1 誤區1:一次只部署一個或兩個機器學習模型 7 1 2 誤區2:如果什麼都不做,模型性能會保持不變 7 1 3 誤區3:不需要過多地對模型進行更新 7 1 4 誤區4:大多數機器學習工程師不需要擔心規模化 7 2 批量預測與在線預測 7 2 1 從批量預測到在線預測 7 2 2 統一批處理流水線和流處理流水線 7 3 模型壓縮 7 3 1 低秩分解 7 3 2 知識蒸餾 7 3 3 剪枝 7 3 4 量化 7 4 雲端機器學習和邊緣設備機器學習 7 4 1 為邊緣設備編譯和優化模型 7 4 2 瀏覽器中的機器學習 7 5 本章小結 第8章 數據分佈偏移和監控 8 1 機器學習系統故障的原因 8 1 1 軟體系統故障 8 1 2 機器學習特有的故障 8 2 數據分佈偏移 8 2 1 不同類型的數據分佈偏移 8 2 2 其他數據分佈偏移 8 2 3 檢測數據分佈偏移 8 2 4 解決數據分佈偏移 8 3 監控和可觀察性 8 3 1 機器學習特有指標 8 3 2 監控工具箱 8 3 3 可觀察性 8 4 本章小結 第9章 在生產環境中的持續學習和測試 9 1 持續學習 9 1 1 無狀態重訓練與有狀態訓練 9 1 2 為什麼要持續學習? 9 1 3 持續學習的挑戰 9 1 4 持續學習的四個階段 9 1 5 模型的更新頻率 9 2 生產環境中的測試 9 2 1 影子部署 9 2 2 A/B測試 9 2 3 金絲雀發布 9 2 4 交錯實驗 9 2 5 多臂老虎機 9 3 本章小結 第10章 MLOps的基礎設施和工具 10 1 存儲和計算 10 2 開發環境 10 2 1 設置開發環境 10 2 2 開發環境標準化 10 2 3 從開發環境到生產環境:容器技術 10 3 資源管理 10 3 1 定時任務(Cron)、調度器和編排器 10 3 2 數據科學工作流程管理 10 4 機器學習平台 10 4 1 模型部署 10 4 2 模型存儲 10 4 3 特徵存儲 10 5 自建或外購 10 6 本章小結 第11章 人與機器學習 11 1 用戶體驗 11 1 1 確保用戶體驗一致性 11 1 2 對抗「通常正確」的預測 11 1 3 平穩失敗 11 2 團隊結構 11 2 1 跨職能團隊合作 11 2 2 端到端數據科學家 811 3 負責任的人工智慧 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |