大語言模型-原理與工程實踐 楊青 9787121473043 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:電子工業
NT$757
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*數量非實際在台庫存
*完成訂單後正常情形下約兩周可抵台

*本賣場提供之資訊僅供參考,以到貨標的為實際資訊。
印行年月:202403*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大語言模型-原理與工程實踐
ISBN:9787121473043
出版社:電子工業
著編譯者:楊青
叢書名:通用智能與大模型叢書
頁數:247
所在地:中國大陸 *此為代購商品
書號:1619424
可大量預訂,請先連絡。

內容簡介

本書用10章對大語言模型進行全面且深入的介紹。首先對大語言模型的基本概念進行介紹。其次,從大語言模型的基礎技術、預訓練數據構建、預訓練技術等方面展開討論,幫助讀者深入了解大語言模型的構建和訓練過程。然後,詳細介紹有監督微調和強化對齊等技術,以及如何評估大語言模型的性能。此外,介紹提示工程和工程實踐等方面的內容,幫助讀者了解大語言模型的應用和實際操作過程。最後,介紹如何從零開始微調大語言模型,輔以代碼示例,幫助讀者更好地應用這些技術。 通過閱讀本書,讀者可以獲得全面且深入的大語言模型的知識框架。無論您是研究人員、工程師,還是產品經理,都能從中獲得有價值的知識。

作者簡介

楊青,度小滿金融技術委員會執行主席、數據智能應用部總經理,碩士畢業於清華大學計算機系,曾就職于百度、阿里巴巴,從事自然語言處理、搜索、推薦、大數據架構等相關方向的研發工作。 2018年年初加入度小滿金融,組建數據智能部,從0到1構建度小滿金融的智能引擎核心演算法,深耕計算機視覺、自然語言處理、圖模型、機器學習、因果推斷等技術領域,多篇文章被EMNLP、ACL、CIKM等國際會議收錄,「智能化徵信解讀中台」工程榮獲吳文俊人工智慧科技進步獎。相關技術廣泛應用於度小滿營銷、經營、風控、反欺詐全流程業務場景,為上千萬客戶提供穩定、安全的金融服務。

目錄

1 解鎖大語言模型
1 1 什麼是大語言模型
1 2 語言模型的發展
1 3 GPT系列模型的發展
1 4 大語言模型的關鍵技術
1 5 大語言模型的湧現能力
1 6 大語言模型的推理能力
1 7 大語言模型的縮放定律
參考文獻
2 大語言模型基礎技術
2 1 語言表示介紹
2 1 1 詞表示技術
2 1 2 分詞技術
2 2 經典結構Transformer
2 2 1 輸入模塊
2 2 2 多頭自注意力模塊
2 2 3 殘差連接與層歸一化
2 2 4 前饋神經網路
2 2 5 解碼器
2 3 預訓練語言模型
2 3 1 Decoder的代表:GPT系列
2 3 2 Encoder的代表:BERT
2 4 初探大語言模型
2 4 1 InstructGPT
2 4 2 LLaMA系列
參考文獻
3 預訓練數據構建
3 1 數據的常見類別及其來源
3 1 1 網頁數據
3 1 2 書籍數據
3 1 3 百科數據
3 1 4 代碼數據
3 1 5 其他數據
3 2 數據的預處理方式
3 2 1 正文提取
3 2 2 質量過濾
3 2 3 文檔去重
3 2 4 數據集凈化
3 3 常用數據集的完整構建方式
3 3 1 C4
3 3 2 MassiveText
3 3 3 RefinedWeb
3 3 4 ROOTS
3 4 難點和挑戰
3 4 1 數據收集的局限性
3 4 2 數據質量評估的挑戰
3 4 3 自動生成數據的風險
參考文獻
4 大語言模型預訓練
4 1 大語言模型為什麼這麼強
4 2 大語言模型的核心模塊
4 2 1 核心架構
4 2 2 組成模塊選型
4 3 大語言模型怎麼訓練
4 3 1 訓練目標
4 3 2 數據配比
4 4 預訓練還有什麼沒有解決
參考文獻
5 挖掘大語言模型潛能:有監督微調
5 1 揭開有監督微調的面紗
5 1 1 什麼是有監督微調
5 1 2 有監督微調的作用與意義
5 1 3 有監督微調的應用場景
5 2 有監督微調數據的構建
5 2 1 有監督微調數據的格式
5 2 2 有監督微調數據的自動化構建
5 2 3 有監督微調數據的選擇
5 3 大語言模型的微調方法
5 3 1 全參數微調
5 3 2 適配器微調
5 3 3 前綴微調
5 3 4 提示微調
5 3 5 低秩適配
5 4 大語言模型的微調和推理策略
5 4 1 混合微調策略
5 4 2 基於上下文學習的推理策略
5 4 3 基於思維鏈的推理策略
5 5 大語言模型微調的挑戰和探索
5 5 1 大語言模型微調的幻覺問題
5 5 2 大語言模型微調面臨的挑戰
5 5 3 大語言模型微調的探索與展望
參考文獻
6 大語言模型強化對齊
6 1 強化學習基礎
6 1 1 強化學習的基本概念
6 1 2 強化學習中的隨機性
6 1 3 強化學習的目標
6 1 4 Q函數與V函數
6 2 DQN方法
6 2 1 DQN的結構
6 2 2 DQN訓練:基本思想
6 2 3 DQN訓練:目標網路
6 2 4 DQN訓練:探索策略
6 2 5 DQN訓練:經驗回放
6 2 6 DQN訓練:完整演算法
6 2 7 DQN決策
6 3 策略梯度方法
6 3 1 策略網路的結構
6 3 2 策略網路訓練:策略梯度
6 3 3 策略網路訓練:優勢函數
6 3 4 PPO演算法
6 4 揭秘大語言模型中的強化建模
6 4 1 Token-level強化建模
6 4 2 Sentence-level強化建模
6 5 獎勵模型
6 5 1 獎勵模型的結構
6 5 2 獎勵模型的訓練
6 5 3 獎勵模型損失函數分析
6 6 RLHF
6 6 1 即時獎勵
6 6 2 RLHF演算法
6 7 RLHF實戰框架
6 8 RLHF的難點和問題
6 8 1 數據瓶頸
6 8 2 硬體瓶頸
6 8 3 方法瓶頸
參考文獻
7 大語言模型的評測
7 1 基座語言模型的評測
7 1 1 主要的評測維度和基準概述
7 1 2 具體案例:LLaMA 2選取的評測基準
7 2 大語言模型的對話能力評測
7 2 1 評測任務
7 2 2 評測集的構建標準
7 2 3 評測方式
7 3 大語言模型的安全性評測
7 3 1 評測任務
7 3 2 評測方式和標準
7 4 行業大語言模型的評測:以金融行業大語言模型為例
7 4 1 金融行業大語言模型的自動化評測集
7 4 2 金融行業大語言模型的人工評測集
7 5 整體能力的評測
7 6 主流評測數據集及基準
參考文獻
8 大語言模型的應用
8 1 大語言模型為什麼需要提示工程
8 1 1 人類和大語言模型進行複雜決策的對比
8 1 2 提示工程的作用
8 2 什麼是提示詞
8 2 1 提示詞的基礎要素
8 2 2 提示詞設計的通用原則
8 3 推理引導
8 3 1 零樣本提示
8 3 2 少樣本提示
8 3 3 思維鏈提示
8 3 4 自我一致性提示
8 3 5 思維樹提示
8 4 動態交互
8 4 1 檢索增強生成技術
8 4 2 推理和行動協同技術
8 5 案例分析
8 5 1 案例介紹
8 5 2 工具設計
8 5 3
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理