分布式機器學習-系統、工程與實戰 柳浩 9787121458149 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:電子工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$884
商品編號: 9787121458149
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202307*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:分布式機器學習-系統、工程與實戰
ISBN:9787121458149
出版社:電子工業
著編譯者:柳浩
頁數:575
所在地:中國大陸 *此為代購商品
書號:1540708
可大量預訂,請先連絡。

內容簡介

本書主要講解分散式機器學習演算法和開源框架,讀者既可以從宏觀的設計上了解分散式機器學習的概念和理論,也可以深入核心技術的細節設計中,對分散式機器學習形成深刻而直觀的認識,做到學以致用。 本書共分為5篇,第1篇是分散式基礎,首先介紹了分散式機器學習的概念、基礎設施,以及機器學習并行化技術、框架和軟體系統,然後對集合通信和參數伺服器PS-Lite進行了介紹。第2篇是數據并行,以PyTorch和Horovod為主對數據并行進行分析,讀者可以了解在具體工程領域內實現數據并行有哪些挑戰和解決方案。第3篇是流水線并行,講解了除模型劃分之外,還通過引入額外的流水線來提高效率,以GPipe/PyTorch/PipeDream為例進行分析。第4篇是模型并行,首先對NVIDIAMegatron進行分析,講解如何進行層內模型并行,然後講解PyTorch如何支持模型并行,最後介紹分散式優化器。第5篇是TensorFlow分散式,前面幾篇以PyTorch為綱,結合其他框架/庫來穿插完成, 本篇帶領大家進入TensorFlow分散式領域。

作者簡介

柳浩,網名「羅西的思考」,浙江大學碩士。曾就職于多家世界500強企業,主導過多個大型項目,現就職于某新能源車企。技術棧廣博,有豐富的各種大型軟體開發和系統架構經驗,對機器學習框架、微服務框架、大數據引擎、NoSQL、消息隊列、分散式追蹤系統、可觀測系統、可靠性設計、移動開發方案和源碼有著深刻的理解和認識。

目錄

第1篇 分散式基礎
第1章 分散式機器學習
1 1 機器學習概念
1 2 機器學習的特點
1 3 分散式訓練的必要性
1 4 分散式機器學習研究領域
1 4 1 分散式機器學習的目標
1 4 2 分散式機器學習的分類
1 5 從模型角度看如何并行
1 5 1 并行方式
1 5 2 數據并行
1 5 3 模型并行
1 5 4 流水線并行
1 5 5 比對
1 6 從訓練併發角度看如何并行
1 6 1 參數分佈和通信拓撲
1 6 2 模型一致性和通信模式
1 6 3 訓練分佈
1 7 分散式機器學習編程介面
1 7 1 手動同步更新
1 7 2 指定任務和位置
1 7 3 猴子補丁優化器
1 7 4 Python作用域
1 8 PyTorch分散式
1 8 1 歷史脈絡
1 8 2 基本概念
1 9 總結
第2章 集合通信
2 1 通信模式
2 2 點對點通信
2 3 集合通信
2 3 1 Broadcast
2 3 2 Scatter
2 3 3 Gather
2 3 4 All-Gather
2 3 5 All-to-All
2 3 6 Reduce
2 3 7 All-Reduce
2 3 8 Reduce-Scatter
2 4 MPI_AllReduce
2 5 Ring All-Reduce
2 5 1 特點
2 5 2 策略
2 5 3 結構
2 5 4 Reduce-Scatter
2 5 5 All-Gather
2 5 6 通信性能
2 5 7 區別
第3章 參數伺服器之PS-Lite
3 1 參數伺服器
3 1 1 概念
3 1 2 歷史淵源
3 1 3 問題
3 2 基礎模塊Postoffice
3 2 1 基本邏輯
3 2 2 系統啟動
3 2 3 功能實現
3 3 通信模塊Van
3 3 1 功能概述

第2篇 數據并行
第3篇 流水線并行
第4篇 模型并行
第5篇 TensorFlow分散式

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理