| *數量非實際在台庫存 *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為實際資訊。 印行年月:202401*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:大規模語言模型-從理論到實踐 ISBN:9787121467059 出版社:電子工業 著編譯者:張奇 叢書名:通用智能與大模型叢書 頁數:306 所在地:中國大陸 *此為代購商品 書號:1596278 可大量預訂,請先連絡。 內容簡介 本書詳細介紹了構建大語言模型的四個主要階段:預訓練、有監督微調、獎勵建模和強化學習。每個階段都有演算法、代碼、數據、難點及實踐經驗的詳細討論。 本書以大語言模型的基礎理論開篇,探討了大語言模型預訓練數據的構建方法,以及大語言模型如何理解並服從人類指令,介紹了大語言模型的擴展應用和評估方法,為讀者提供了更全面的視野。 本書旨在為對大語言模型感興趣的讀者提供入門指南,也可作為高年級本科生和研究生自然語言處理相關課程的補充教材。作者簡介 黃萱菁,復旦大學計算機科學技術學院教授、博士生導師。主要從事自然語言處理、信息檢索和社會媒體分析研究。兼任中國中文信息學會常務理事、社會媒體專委會副主任,中國計算機學會自然語言處理專委會副主任、學術工作委員會委員、AACL執委。在高水平國際學術期刊和會議上發表了百余篇論文,負責的多個科研項目受到國家自然科學基金、科技部、教育部、上海市科委的支持。入選2020年度人工智慧全球女性、2020年度AI 2000人工智慧全球最具影響力提名學者及福布斯中國2020科技女性榜。目錄 第1章 緒論1 1 大語言模型的基本概念 1 2 大語言模型的發展歷程 1 3 大語言模型的構建流程 1 4 本書的內容安排 第2章 大語言模型基礎 2 1 Transformer結構 2 1 1 嵌入表示層 2 1 2 注意力層 2 1 3 前饋層 2 1 4 殘差連接與層歸一化 2 1 5 編碼器和解碼器結構 2 2 生成式預訓練語言模型GPT 2 2 1 無監督預訓練 2 2 2 有監督下游任務微調 2 2 3 基於HuggingFace的預訓練語言模型實踐 2 3 大語言模型的結構 2 3 1 LLaMA的模型結構 2 3 2 注意力機制優化 2 4 實踐思考 第3章 大語言模型預訓練數據 3 1 數據來源 3 1 1 通用數據 3 1 2 專業數據 3 2 數據處理 3 2 1 質量過濾 3 2 2 冗餘去除 3 2 3 隱私消除 3 2 4 詞元切分 3 3 數據影響分析 3 3 1 數據規模 3 3 2 數據質量 3 3 3 數據多樣性 3 4 開源數據集 3 4 1 Pile 3 4 2 ROOTS 3 4 3 RefinedWeb 3 4 4 SlimPajama 3 5 實踐思考 第4章 分散式訓練 4 1 分散式訓練概述 4 2 分散式訓練的并行策略 4 2 1 數據并行 4 2 2 模型并行 4 2 3 混合併行 4 2 4 計算設備內存優化 4 3 分散式訓練的集群架構 4 3 1 高性能計算集群的典型硬體組成 4 3 2 參數伺服器架構 4 3 3 去中心化架構 4 4 DeepSpeed實踐 4 4 1 基礎概念 4 4 2 LLaMA分散式訓練實踐 4 5 實踐思考 第5章 有監督微調 5 1 提示學習和語境學習 5 1 1 提示學習 5 1 2 語境學習 5 2 高效模型微調 5 2 1 LoRA 5 2 2 LoRA的變體 5 3 模型上下文窗口擴展 5 3 1 具有外推能力的位置編碼 5 3 2 插值法 5 4 指令數據的構建 5 4 1 手動構建指令 5 4 2 自動構建指令 5 4 3 開源指令數據集 5 5 DeepSpeed-Chat SFT實踐 5 5 1 代碼結構 5 5 2 數據預處理 5 5 3 自定義模型 5 5 4 模型訓練 5 5 5 模型推理 5 6 實踐思考 第6章 強化學習 6 1 基於人類反饋的強化學習 6 1 1 強化學習概述 6 1 2 強化學習與有監督學習的區別 6 1 3 基於人類反饋的強化學習流程 6 2 獎勵模型 6 2 1 數據收集 6 2 2 模型訓練 6 2 3 開源數據 6 3 近端策略優化 6 3 1 策略梯度 6 3 2 廣義優勢估計 6 3 3 近端策略優化演算法 6 4 MOSS-RLHF實踐 6 4 1 獎勵模型訓練 6 4 2 PPO微調 6 5 實踐思考 第7章 大語言模型應用 7 1 推理規劃 7 1 1 思維鏈提示 7 1 2 由少至多提示 7 2 綜合應用框架 7 2 1 LangChain框架核心模塊 7 2 2 知識庫問答系統實踐 7 3 智能代理 7 3 1 智能代理的組成 7 3 2 智能代理的應用實例 7 4 多模態大語言模型 7 4 1 模型架構 7 4 2 數據收集與訓練策略 7 4 3 多模態能力示例 7 5 大語言模型推理優化 7 5 1 FastServe框架 7 5 2 vLLM推理框架實踐 7 6 實踐思考 第8章 大語言模型評估 8 1 模型評估概述 8 2 大語言模型評估體系 8 2 1 知識與能力 8 2 2 倫理與安全 8 2 3 垂直領域評估 8 3 大語言模型評估方法 8 3 1 評估指標 8 3 2 評估方法 8 4 大語言模型評估實踐 8 4 1 基礎模型評估 8 4 2 SFT模型和RL模型評估 8 5 實踐思考 參考文獻 索引 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |