作者簡介 馮洋,南京大學計算機科學與技術系副教授。2019年在加州大學歐文分校獲得博士學位。主要研究方向為複雜軟體系統的質量保障及可信程序設計語言工程技術,研究課題包括大型複雜軟體系統的質量保障問題及可信軟體基礎設施構建與工程技術問題。主持和參与了多項國家和省部級科研項目,包括國家重大專項計劃、自然科學基金面上項目和青年項目。近年來在軟體工程領域的ICSE、FSE、ASE、ISSTA、TSE、TOSEM、《中國科學》《軟體學報》等期刊和會議發表學術論文40餘篇,獲得ACM傑出論文獎兩次。申請發明專利多項,部分專利成果已經在華為、百度等知名公司轉化應用。
目錄 前言
第一部分 理論基礎與開發準備
第1章 大語言模型基礎
1 1 大語言模型概述
1 1 1 大語言模型發展歷史
1 1 2 大語言模型發展現狀
1 2 模型的基本架構
1 2 1 Transformer架構解析
1 2 2 編碼器-解碼器
1 2 3 注意力機制詳解
1 3 大語言模型應用開發基礎
1 3 1 與大語言模型相關的Python開發技術
1 3 2 React開發框架
1 4 大語言模型訓練原理簡介
1 4 1 LoRA微調技術
1 4 2 Prompt改進:P-Tuning
1 4 3 人類反饋強化學習
第2章 大語言模型應用開發基礎
2 1 CUDA并行編程技術
2 1 1 CUDA編程模型與架構原理
2 1 2 基於CUDA的矩陣運算與優化實現
2 1 3 CUDA內核性能調優與工具使用
2 2 基於PyTorch的大語言模型構建方法
2 2 1 PyTorch核心模塊解析:數據載入與模型定義
2 2 2 自動微分與優化器的實現原理
2 2 3 多GPU分散式訓練與性能優化
2 3 Nginx web伺服器開發
2 3 1 Nginx核心模塊與配置解析
2 3 2 使用Nginx處理靜態與動態內容
2 3 3 高併發場景下的性能調優
2 4 Hugging Face的Transformer庫
2 4 1 Transformer庫基礎:模型載入與簡單推理
2 4 2 自定義微調流程:從數據準備到模型訓練
2 4 3 模型導出與量化加速推理
2 5 API開發與雲端部署
2 5 1 FastAPI框架快速搭建RESTful介面
2 5 2 部署深度學習模型服務:從本地到雲端
2 5 3 介面性能監控與日誌管理工具開發
第二部分 核心技術解析與優化
第3章 大語言模型微調與應用實戰
3 1 基於LLaMA3模型的微調技術
3 1 1 微調場景分析:任務分類、文本生成與問答
3 1 2 微調數據準備與預處理
3 1 3 微調過程實現:凍結層優化與增量學習
3 2 基於GeMMA-7B模型的微調技術
3 2 1 GeMMA-7B模型的任務適配:多任務微調方法
3 2 2 數據增強技術在微調中的應用
3 2 3 高效微調工具鏈:使用Hugging Face與PEFT方法
3 3 案例實戰:企業文檔問答平台
3 3 1 企業文檔問答任務需求分析與功能模塊劃分
3 3 2 構建企業文檔問答系統
3 3 3 微調、部署與性能測試
第4章 模型量化、編譯與推理
4 1 大語言模型量化原理
4 1 1 模型量化技術簡介:從FP32到INT8的精度降低方法
4 1 2 量化算法實現:動態量化與靜態量化的技術差異
4 1 3 量化對推理性能的影響分析:速度提升與硬體加速
4 2 基於LLaMA3模型的量化過程
4 2 1 模型編譯
4 2 2 模型載入
4 2 3 模型量化與測試
4 2 4 通過Nginx運行量化模型
4 3 基於GeMMA-7B模型的量化過程
4 3 1 模型編譯
4 3 2 模型載入
4 3 3 模型量化與測試
4 3 4 通過Nginx運行量化模型
4 4 量化模型與推理
4 4 1 INT8推理框架對比:TensorRT與ONNX Runtime的應用
4 4 2 量化模型的實時推理
第三部分 行業應用開發與實戰
第5章 服務類應用開發:電商智能客服平台
5 1 客服平台需求分析與功能規劃
5 1 1 電商場景中的常見客服需求分析
5 1 2 智能客服功能模塊分解:對話生成、問題匹配與用戶情緒檢測
5 1 3 技術架構設計:對話模型與後端服務的集成
5 2 數據收集與清洗:構建電商客服知識庫
5 2 1 知識庫構建的流程與數據來源分析:商品信息與用戶問題整合
5 2 2 數據清洗與分類技術:停用詞過濾、分詞與主題標籤提取
5 2 3 數據增強與擴展方法:同義詞替換與多語言支持
5 3 模型選擇與微調:定製化客服模型開發
5 3 1 選擇合適的預訓練模型:對比BERT、GPT與T5的適用場景
5 3 2 微調對話生成模型:訓練FAQ匹配與上下文生成能力
5 3 3 模型評估與優化:BLEU、ROUGE等指標的使用與調優
5 4 聊天邏輯與上下文管理實現
5 4 1 多輪對話上下文管理:用戶意圖識別與歷史對話跟蹤
5 4 2 對話狀態追蹤與轉移:Slot Filling技術的應用
5 4 3 自然對話中的中斷與恢復邏輯處理
5 5 實時問答API與平台部署
5 5 1 API設計與開發:實現多輪對話與知識檢索介面
5 5 2 實時部署與性能優化:負載均衡與延遲優化
第6章 生產類應用開發:編程輔助插件
6 1 編程輔助需求分析與插件架構設計
6 1 1 需求分解:語法檢查、代碼生成與性能優化
6 1 2 數據流、後端邏輯與UI組件分離
6 2 編程語言模型微調:從代碼生成到Bug修復
6 2 1 代碼生成任務微調:從小樣本學習到語法生成
6 2 2 錯誤檢測與修復模型實現:代碼標註與錯誤模式
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。