內容簡介
本書從大型模型的結構講起,讓讀者瞭解大型模型的內部實現原理,然後講解如何在特定任務下對大型模型進行預訓練、有監督的微調,以及進行強化學習。通過對模型採用不同方法的訓練,持續改進模型在特定任務上的性能。最後,本書將與讀者一起探討如何利用大型模型開發大模型時代的智能應用。
本書共9章,第1章 講解大型模型發展的歷史及其帶來的變革。第2章 深入講解大型模型內部結構的演進。第3章 會嘗試自己運行一個大模型。第4章 介紹大型模型對模型訓練和推理過程中帶來的技術挑戰和解決辦法。第5章 講解如何進行大型模型的預訓練以獲取大模型的基本能力。第6章 講解如何對大模型進行有監督的微調,使大型模型輸出與人類意圖對齊。第7章 講解如何通過強化學習進一步提升大型模型的表現。第8章 講解如何對大模型進行評估。第9章 講解如何利用大模型構建智能應用。
本書適合有一定深度學習基礎的讀者,幫助他們從原理到應用,快速瞭解大型模型的原理、訓練方法,並利用大型模型進行智能應用的開發。
作者簡介
薛鵬,深圳力維智聯技術有限公司人工智能首席科學家,上海迥靈信息技術有限公司CTO,原IBM AI產品Tech Lead。負責研發多款AI產品,十五年人工智能技術應用經驗。目前致力於大模型平臺產品研發和大模型技術行業應用。
目錄
第1章 大模型時代
1 1 大模型的發展歷史
1 1 1 注意力機制的發揚光大
1 1 2 從GPT到InstructGPT
1 1 3 ChatGPT驚豔登場
1 1 4 全球首個AI程序員誕生
1 2 大模型時代的新範式
第2章 深入瞭解大模型
2 1 Transformer橫空出世
2 1 1 詞典生成
2 1 2 詞嵌入
2 1 3 自注意力機制
2 1 4 層歸一化
2 1 5 殘差連接
2 1 6 前饋模塊
2 1 7 Transformer的整體架構
2 1 8 位置編碼
2 1 9 解碼器的輸入輸出
2 1 10 掩碼機制
2 1 11 交叉注意力
2 1 12 線性分類頭
2 2 GPT
2 2 1 GPT-1
2 2 2 GPT-2
2 2 3 GPT-3
2 2 4 GPT-4
2 3 OpenAI o1
2 4 Llama
2 4 1 Llama1
2 4 2 Llama2
2 4 3 Llama3
第3章 運行第1個大模型
3 1 HuggingFace介紹
3 2 下載大模型
3 3 運行大模型
3 4 HuggingFace裡的Tokenizer
3 5 HuggingFace裡的模型
3 5 1 創建和保存模型
3 5 2 控制大模型的輸出
第4章 大模型帶來的技術挑戰
4 1 GPU的工作原理
4 1 1 CPU和GPU的區別
4 1 2 GPU的架構
4 1 3 GPU裡的存儲
4 1 4 Tensor Core
4 2 大模型顯存佔用
4 3 優化器
4 3 1 指數加權平均
4 3 2 SGD
4 3 3 動量梯度下降
4 3 4 RMSProp
4 3 5 Adam
4 3 6 AdamW
4 4 混合精度訓練
4 4 1 混合精度訓練原理
4 4 2 在PyTorch裡進行混合精度訓練
4 5 模型的量化技術
4 5 1 量化技術的原理
4 5 2 訓練後動態量化
4 5 3 訓練後靜態量化
4 5 4 量化感知訓練
4 5 5 LLM int8
4 5 6 NF4量化
4 6 梯度累加
4 7 梯度檢查點
4 8 分布式訓練
4 8 1 分布式數據並行
4 8 2 DeepSpeed ZeRO
4 8 3 Accelerate
4 9 參數高效微調
4 9 1 提示詞微調
4 9 2 LoRA
4 10 vLLM
4 10 1 KV Cache
4 10 2 Page Attention
4 10 3 塊共享
4 10 4 代碼示例
4 11 FlashAttention
第5章 大模型的預訓練
5 1 預訓練的作用
5 2 預訓練的數據
5 3 預訓練的方法
5 4 1 最簡訓練代碼
5 4 2 數據清洗
5 4 3 數據準備
5 4 4 初始化模型
5 4 5 模型預訓練
第6章 大模型的監督微調
6 1 對話模板
6 2 只關注回答
6 3 噪聲嵌入微調
6 4 SFT Trainer
第7章 大模型的強化學習
7 1 強化學習基礎
7 1 1 強化學習裡的基礎概念
7 1 2 策略梯度算法
7 1 3 Actor-Critic算法
7 1 4 廣義優勢估計算法
7 2 近端策略優化
7 3 直接偏好優化
7 3 1 K-L散度
7 3 2 Bradley-Terry模型
7 3 3 DPO的訓練目標
7 4 利用TRL庫進行PPO訓練
7 4 1 獎勵模型
7 4 2 PPO模型
第8章 大模型的評估
8 1 困惑度
8 2 人工評估
8 3 可解析的測評集
8 3 1 MMLU
8 3 2 MMLU-PRO
8 3 3 IF-EVAL
8 3 4 BBH
8 3 5 MATH
8 3 6 GPQA
8 4 利用大模型評估
第9章 構建大模型應用
9 1 提示詞工程
9 1 1 明確的任務指示
9 1 2 提供上下文信息
9 1 3 賦予大模型角色
9 1 4 給模型思考時間
9 1 5 給模型參考示例
9 2 LangChain介紹
9 3
第1個LangChain程序
9 4 構建一個聊天機器人
9 5 LangChain的進階功能
9 5 1 對輸出進行解析
9 5 2 為提示詞增加樣例
9 6 檢索增強生成
9 6 1 RAG流程
9 6 2 文檔分片
9 6 3 向量嵌入模型
9 6 4 向量存儲
9 6 5 Retriever
9 6 6 生成回答
9 7 RAG進階
9 7 1 問題轉化
9 7 2 混合檢索
9 7 3 索引增強
9 7 4 檢索結果重排
9 8 智能體
9 8 1 創建第1個智能體
9 8 2 給智能體定義工具
9 8 3 智能體使用工具的原理
9 8 4 給智能體增加記憶
9 8 5 人與智能體合作
9 8 6 多智能體協作
前言/序言
時間回到2010年,筆者剛剛加入IBM SPSS Modeler的研發團隊,從此開始了筆者在人工智能領域的職業生涯。轉眼間,這段旅程已經持續了十五年。這十五年裡,人工智能的發展波瀾壯闊,筆者有幸站在科技的潮頭,見證了3次極具意義的浪潮。每次浪潮都代表了人類對於智能的探索邁入了新的階段,每次浪潮也深刻地改變了科技的邊界,社會的面貌,以及我們的日常生活。
在筆者的職業生涯中,第1次人工智能浪潮可以追溯到卷積神經網絡的崛起。這一波浪潮最具代表性的事件,也就是深度學習在計算機視覺領域的突破性進展。從2012年AlexNet在ImageNet比賽上的驚豔表現開始,計算機視覺得以迅猛發展,神經網絡在圖像識別、物體檢測、人臉識別等領域逐漸超過了人類的表現。可以說,卷積神經網絡讓計算機具備了”看”的能力,得以從數億像素中理解出形狀和內容。那一時期,視覺任務相對容易取得突破,這在一定程度上歸功於圖像本身所包含的直觀且自成一體的信息。就像一個三歲小孩能夠通過圖像辨別出水果、動物、人物一樣,計算機在有了強大的視覺模型之後也能通過學習海量的圖片,較為準確地判斷圖像中包含了什麼。
然而,語言是另外一個層次的挑戰。語言是人類社會最自然的溝通工具,卻充滿了歧義和複雜的語境。一句話中的每個詞匯都可能包含多重含義,需要結合上下文乃至社會背景去理解,尤其是在日常交流中,隱含的諷刺、幽默,甚至體察情緒的能力遠遠超過一個剛學會說話的孩子。這就意味著,語言理解和生成任務對計算機來講要比視覺更具挑戰。
這就帶來了第2次人工智能浪潮: 基於Transformer的BERT預訓練模型的出現。BERT模型通過利用大量語料和創新性的訓練方法(例如前後句判斷和完形填空式的掩碼訓練)讓模型逐漸學會理解語義和語境。這一階段,基於Transformer架構的模型使自然語言處理實現了跨越式的發展。與之前的循環神經網絡相比,Transformer顯著地提高了訓練效率,通過自注意力機制,不僅能並行處理序列數據,還能在長句中抓住遠距離詞語之間的關聯。BERT的出現使NLP各項任務達到了前所未有的高度——機器能夠理解段落、回答問題、生成摘要,並且通過預訓練與下游任務微調的結合方式,有效地解決了許多工程應用中的問題。
然後我們迎來了第3次浪潮,這一浪潮就是當前的大模型革命。GPT系列的出現,尤其是GPT3的出現和ChatGPT的廣泛傳播,讓人工智能不再局限於特定領域,而是成為全社會的討論熱點。GPT3不僅是一種模型,它的能力和表現讓我們重新思考人與機器之間的互動模式。通過自然語言,GPT3具備了與人類進行複雜對話、進行推理、提供創意建議的能力,ChatGPT的出現更是掀起了一場關於人工智能將如何改變社會的全民討論。這是我們朝向通用人工智能邁出的重要一步,各行各業都在思考大模型將如何徹底變革其生產模式和交互方式。
大模型的崛起帶來了前所未有的理解、推理、生成的通用能力,也改變了人類與機器的交互方式。在這個大模型的時代,人與機器之間的界限變得越來越模糊,機器不再只是簡單地接受命令,它開始具備理解上下文、推測人類意圖,甚至具有一定創造力的能力。這種變革不僅是技術上的突破,更是一次對於人類社會運作方式的重新定義。
筆者深感非常幸運,能夠處在這樣一個激動人心的時代。人工智能的大浪潮,既推動了時代的進步,也讓我們這些從業者成為這場偉大變革的親歷者。筆者感受到的,不只是對於技術進步的震撼,更是對於未來無限可能性的憧憬。
本書旨在和讀者一起探索大模型的原理、發展和應用,筆者希望通過本書,能夠幫助更多的讀者理解大模型背後的技術,感受到它所帶來的改變。無論你是科技愛好者,還是從事其他領域的專業人士,筆者相信你都能在這場變革中找到屬_xFFFF_自己的啟發和機遇。
希望我們能夠共同見證大模型時代的到來,也希望我們能夠攜手探索,用大模型技術去改變我們的生活,讓人工智能成為我們日常的助手、夥伴,甚至靈感的源泉。讓我們一起迎接這個充滿希望和挑戰的未來。
資源下載提示
素材(源碼)等資源: 掃描
目錄上方的二維碼下載。
視頻等資源: 掃描封底的文泉雲盤防盜碼,再掃描書中相應章 節 的二維碼,可以在線學習。
筆者的閱歷有限,書中難免存在疏漏,希望讀者熱心指正,在此表示感謝。
薛鵬
2025年5月于西安
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。