大模型理論與實踐-打造行業智能助手 林明 9787302686620 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$375
商品編號: 9787302686620
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202505*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大模型理論與實踐-打造行業智能助手
ISBN:9787302686620
出版社:清華大學
著編譯者:林明
頁數:155
所在地:中國大陸 *此為代購商品
書號:1732106
可大量預訂,請先連絡。

內容簡介

本書以打造行業智能助手為主線,全面介紹大模型的理論與實踐。本書在內容上側重於實踐,兼顧理論的系統性。全書共4部分:第1部分為大模型導論(第1章),介紹大模型的相關概念以及大模型的過去、現在與未來;第2部分為理論知識(第2、3章),介紹大模型基礎知識和大語言模型分散式訓練;第3部分為實踐(第4~7章),介紹大模型的繼續預訓練、對齊、推理與部署,通過實際案例詳細介紹如何打造行業智能助手並將其部署到生產環境中;第4部分為高級主題(第8、9章),介紹多模態大模型、AI智能體的最新進展。 本書可以作為大模型領域技術人員的參考書,同時也可以供有志於從事大模型工作的高校相關專業本科生以及從搜索、自然語言處理等方向轉向大模型的專業人員自學。

作者簡介

林明畢業於清華大學計算機科學與技術系。 曾是美團搜索和個性化推薦團隊的創始成員,並在去哪兒、悠易互通、商湯等多家知名互聯網公司擔任算法管理職位。在人工智能的多個領域,包括大搜、大模型等有超過十年的研發和管理經驗。同時也是一位活躍的技術社區貢獻者,曾在ArchSummit等頂級技術會議上做過分享。

目錄

第1章 大模型導論
1 1 大模型概念
1 1 1 預訓練
1 1 2 有監督微調
1 1 3 偏好對齊
1 2 大模型的過去、現在與未來
1 2 1 大模型簡史
1 2 2 大模型的現狀
1 2 3 大模型未來展望
1 3 本書的讀者對象與內容
參考文獻
第2章 大模型基礎知識
2 1 分詞
2 1 1 粒度
2 1 2 子詞拆分算法
2 1 3 實現
2 2 位置編碼
2 2 1 RoPE
2 2 2 ALiBi
2 3 網絡結構
2 3 1 Transformer架構
2 3 2 大模型的Transformer架構
2 3 3 MoE模型
2 4 長上下文
2 4 1 採用RoPE位置編碼的長上下文擴展
2 4 2 注意力操作優化
參考文獻
第3章 大語言模型分散式訓練
3 1 大語言模型高效訓練技術要點
3 2 并行模式
3 2 1 數據并行化
3 2 2 流水線并行化
3 2 3 張量并行化
3 3 集合通信
3 3 1 all-reduce操作的分解
3 3 2 all-reduce操作的高效實現
3 4 DeepSpeed訓練加速框架
3 4 1 ZeRO技術
3 4 2 ZeRO技術與流水線并行化結合
3 4 3 ZeRO技術與張量并行化結合
3 5 DeepSpeed訓練方案建議
參考文獻
第4章 繼續預訓練
4 1 繼續預訓練的必要性
4 2 數據預處理
4 2 1 低質數據過濾
4 2 2 去重
4 3 實戰:行業大模型的繼續預訓練
4 3 1 數據準備
4 3 2 數據處理
4 3 3 模型訓練
參考文獻
第5章 對齊(上)——指令微調
5 1 指令微調的必要性
5 2 微調方法
5 2 1 全參微調
5 2 2 部分參數微調
5 3 指令集的自動構造
5 3 1 指令的大規模自動生成
5 3 2 指令集的進化
5 3 3 拒絕採樣
5 4 實戰:打造具有多輪對話能力的行業智能助手
5 4 1 數據準備
5 4 2 數據處理
5 4 3 模型訓練
5 4 4 評測
參考文獻
第6章 對齊(下)——強化學習微調
6 1 強化學習微調的必要性
6 2 人類偏好對齊的強化學習建模
6 3 RLHF
6 3 1 RLHF技術基本流程
6 3 2 獎勵模型
6 3 3 PPO算法
6 4 RLAlF
6 4 1 偏好標註
6 4 2 微調技術路線
6 4 3 評估
6 5 實戰:DeepSpeed-Chat代碼解析
6 5 1 訓練獎勵模型
6 5 2 PPO訓練
6 6 DPO算法
6 6 1 DPO算法目標函數推導
6 6 2 Online DPO算法
參考文獻
第7章 推理與部署
7 1 推理加速
7 1 1 常規工程化手段
7 1 2 自注意力計算訪存優化
7 1 3 推測解碼
7 2 量化
7 2 1 量化感知訓練
7 2 2 訓練后量化
7 3 部署
7 3 1 TensorRT-LLM
7 3 2 vLLM
7 3 3 DeepSpeed Inference
7 3 4 SGLang
7 3 5 平台選型建議
7 4 實戰:使用FastChat部署Qwen 14B
7 4 1 準備工作
7 4 2 部署
參考文獻
第8章 多模態大模型
8 1 多模態技術路線
8 2 橋接多模態大模型
8 2 1 Flamingo
8 2 2 BLIP系列
8 2 3 LLaVA
8 2 4 OneLLM
8 3 原生多模態大模型
8 3 1 Gemini
8 3 2 GPT-4o
8 3 3 Chameleon
參考文獻
第9章 AI智能體
9 1 AI智能體架構
9 1 1 感知
9 1 2 規劃
9 1 3 記憶
9 1 4 行動
9 2 開發框架
9 2 1 LangChain
9 2 2 AutoGen
9 2 3 AGENTS
9 2 4 MetaGPT
參考文獻
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理