大語言模型原理.微調與Agent開發 丁小晶 馬全一 馮洋 9787111784418 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$630
商品編號: 9787111784418
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202507*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大語言模型原理.微調與Agent開發
ISBN:9787111784418
出版社:機械工業
著編譯者:丁小晶 馬全一 馮洋
頁數:282
所在地:中國大陸 *此為代購商品
書號:1745024
可大量預訂,請先連絡。

內容簡介 本書全面探討了大語言模型(通常可簡稱「大模型」)在應用開發中的核心技術與實現。內容涵蓋了大語言模型的基本原理、微調與優化技術、複雜項目開發流程及高效實用的工程實踐案例,通過結構化的模塊設計和詳細的代碼解析,幫助讀者快速掌握相關技術並應用於真實場景,搭建從理論到實踐的完整知識體系。 本書分為四部分,共10章,系統梳理了大語言模型的核心架構與原理,深入講解了Transformer模型的構造與訓練機制,全面介紹了現代微調方法(如LoRA、P-Tuning等)以及模型量化、編譯與推理優化的關鍵技術。針對應用場景,本書結合多個企業級實際案例,包括電商智能客服平台、編程輔助插件、尋人檢索資料庫和硬體開發工程師助理等,詳細展示了從需求分析、數據處理、模型選擇到上線部署的完整開發流程。這些案例不僅強調技術實現,還融入了工程實踐中常見的問題與解決方案,為讀者提供了豐富的參考資料。 本書適合對大語言模型感興趣的技術愛好者、希望深入研究模型微調與優化的科研人員、從事人工智能開發的工程師和產品經理,同時也適合高等院校相關專業學習大語言模型的師生。同時,隨書附贈案例代碼、教學視頻及授課用PPT,讀者可通過掃封底二維碼獲取。無論是初學者學習理論基礎、學生探索前沿技術,還是工程師在一線工作中進行實踐開發,本書都能提供系統化的知識體系和實用的開發技能。

作者簡介 馮洋,南京大學計算機科學與技術系副教授。2019年在加州大學歐文分校獲得博士學位。主要研究方向為複雜軟體系統的質量保障及可信程序設計語言工程技術,研究課題包括大型複雜軟體系統的質量保障問題及可信軟體基礎設施構建與工程技術問題。主持和參与了多項國家和省部級科研項目,包括國家重大專項計劃、自然科學基金面上項目和青年項目。近年來在軟體工程領域的ICSE、FSE、ASE、ISSTA、TSE、TOSEM、《中國科學》《軟體學報》等期刊和會議發表學術論文40餘篇,獲得ACM傑出論文獎兩次。申請發明專利多項,部分專利成果已經在華為、百度等知名公司轉化應用。

目錄 前言
第一部分 理論基礎與開發準備
第1章 大語言模型基礎
1 1 大語言模型概述
1 1 1 大語言模型發展歷史
1 1 2 大語言模型發展現狀
1 2 模型的基本架構
1 2 1 Transformer架構解析
1 2 2 編碼器-解碼器
1 2 3 注意力機制詳解
1 3 大語言模型應用開發基礎
1 3 1 與大語言模型相關的Python開發技術
1 3 2 React開發框架
1 4 大語言模型訓練原理簡介
1 4 1 LoRA微調技術
1 4 2 Prompt改進:P-Tuning
1 4 3 人類反饋強化學習
第2章 大語言模型應用開發基礎
2 1 CUDA并行編程技術
2 1 1 CUDA編程模型與架構原理
2 1 2 基於CUDA的矩陣運算與優化實現
2 1 3 CUDA內核性能調優與工具使用
2 2 基於PyTorch的大語言模型構建方法
2 2 1 PyTorch核心模塊解析:數據載入與模型定義
2 2 2 自動微分與優化器的實現原理
2 2 3 多GPU分散式訓練與性能優化
2 3 Nginx web伺服器開發
2 3 1 Nginx核心模塊與配置解析
2 3 2 使用Nginx處理靜態與動態內容
2 3 3 高併發場景下的性能調優
2 4 Hugging Face的Transformer庫
2 4 1 Transformer庫基礎:模型載入與簡單推理
2 4 2 自定義微調流程:從數據準備到模型訓練
2 4 3 模型導出與量化加速推理
2 5 API開發與雲端部署
2 5 1 FastAPI框架快速搭建RESTful介面
2 5 2 部署深度學習模型服務:從本地到雲端
2 5 3 介面性能監控與日誌管理工具開發
第二部分 核心技術解析與優化
第3章 大語言模型微調與應用實戰
3 1 基於LLaMA3模型的微調技術
3 1 1 微調場景分析:任務分類、文本生成與問答
3 1 2 微調數據準備與預處理
3 1 3 微調過程實現:凍結層優化與增量學習
3 2 基於GeMMA-7B模型的微調技術
3 2 1 GeMMA-7B模型的任務適配:多任務微調方法
3 2 2 數據增強技術在微調中的應用
3 2 3 高效微調工具鏈:使用Hugging Face與PEFT方法
3 3 案例實戰:企業文檔問答平台
3 3 1 企業文檔問答任務需求分析與功能模塊劃分
3 3 2 構建企業文檔問答系統
3 3 3 微調、部署與性能測試
第4章 模型量化、編譯與推理
4 1 大語言模型量化原理
4 1 1 模型量化技術簡介:從FP32到INT8的精度降低方法
4 1 2 量化算法實現:動態量化與靜態量化的技術差異
4 1 3 量化對推理性能的影響分析:速度提升與硬體加速
4 2 基於LLaMA3模型的量化過程
4 2 1 模型編譯
4 2 2 模型載入
4 2 3 模型量化與測試
4 2 4 通過Nginx運行量化模型
4 3 基於GeMMA-7B模型的量化過程
4 3 1 模型編譯
4 3 2 模型載入
4 3 3 模型量化與測試
4 3 4 通過Nginx運行量化模型
4 4 量化模型與推理
4 4 1 INT8推理框架對比:TensorRT與ONNX Runtime的應用
4 4 2 量化模型的實時推理
第三部分 行業應用開發與實戰
第5章 服務類應用開發:電商智能客服平台
5 1 客服平台需求分析與功能規劃
5 1 1 電商場景中的常見客服需求分析
5 1 2 智能客服功能模塊分解:對話生成、問題匹配與用戶情緒檢測
5 1 3 技術架構設計:對話模型與後端服務的集成
5 2 數據收集與清洗:構建電商客服知識庫
5 2 1 知識庫構建的流程與數據來源分析:商品信息與用戶問題整合
5 2 2 數據清洗與分類技術:停用詞過濾、分詞與主題標籤提取
5 2 3 數據增強與擴展方法:同義詞替換與多語言支持
5 3 模型選擇與微調:定製化客服模型開發
5 3 1 選擇合適的預訓練模型:對比BERT、GPT與T5的適用場景
5 3 2 微調對話生成模型:訓練FAQ匹配與上下文生成能力
5 3 3 模型評估與優化:BLEU、ROUGE等指標的使用與調優
5 4 聊天邏輯與上下文管理實現
5 4 1 多輪對話上下文管理:用戶意圖識別與歷史對話跟蹤
5 4 2 對話狀態追蹤與轉移:Slot Filling技術的應用
5 4 3 自然對話中的中斷與恢復邏輯處理
5 5 實時問答API與平台部署
5 5 1 API設計與開發:實現多輪對話與知識檢索介面
5 5 2 實時部署與性能優化:負載均衡與延遲優化
第6章 生產類應用開發:編程輔助插件
6 1 編程輔助需求分析與插件架構設計
6 1 1 需求分解:語法檢查、代碼生成與性能優化
6 1 2 數據流、後端邏輯與UI組件分離
6 2 編程語言模型微調:從代碼生成到Bug修復
6 2 1 代碼生成任務微調:從小樣本學習到語法生成
6 2 2 錯誤檢測與修復模型實現:代碼標註與錯誤模式
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。

規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理