*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202504*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大模型RAG應用開發-構建智能生成系統
ISBN:9787302685982
出版社:清華大學
著編譯者:淩峰
頁數:274
所在地:中國大陸 *此為代購商品書號:1720985
可大量預訂,請先連絡。內容簡介
本書系統介紹檢索增強生成(RAG)技術的核心概念、開發流程和實際應用。本書共分為11章,第1~3章詳細介紹RAG開發的基礎,包括環境搭建、常用工具和模塊,幫助讀者從零開始理解RAG系統的工作原理與開發技巧:第4~8章聚焦RAG系統的具體搭建,從向量資料庫的創建、文本的向量化,到如何構建高效的檢索增強模型,為開發RAG應用奠定基礎;第9~11章通過實際案例,包括企業文檔問答系統、醫療文獻檢索系統和法律法規查詢助手的實際開發,幫助讀者在特定領域深入理解和應用RAG技術。 本書適合RAG技術初學者、大模型和AI研發人員、數據分析和挖掘工程師,以及高年級本科生和研究生閱讀,也可作為培訓機構和高校相關課程的教學用書或參考書。
作者簡介
凌峰,畢業於中國科學院大學,博士,高級職稱,從事機器學習、人工智能、圖像處理、計算視覺的研究與開發工作多年,擁有豐富的機器學習算法實現經驗。
目錄
第1章 搭建RAG開發環境
1 1 Python開發環境搭建
1 1 1 虛擬環境的創建管理
1 1 2 IDE的選擇與工作流的搭建
1 1 3 依賴庫安裝與版本管理
1 2 RAG開發中常用的Python依賴庫
1 2 1 數據處理必備庫:Pandas與NumPy
1 2 2 自然語言處理工具:NLTK與spaCy
1 2 3 向量檢索與模型處理:FAISS與Transformers庫簡介
1 3 RAG開發中常用的外部模塊
1 3 1 數據採集與預處理:Requests與BeautifulSoup
1 3 2 并行與非同步處理:Multiprocessing與Asyncio
1 4 RAG與智能體
1 4 1 智能體的基本定義與作用
1 4 2 智能體的類型:反應型、認知型與學習型
1 5 基於RAG的智能體開發基礎
1 5 1 開發環境與工具
1 5 2 智能體開發中的關鍵算法:搜索、優化與規劃
1 5 3 智能體的性能評估與調試方法
1 6 本章小結
1 7 思考題
第2章 傳統生成與檢索增強生成
2 1 生成式AI和RAG的基本概念
2 1 1 生成式AI的核心原理與工作機制
2 1 2 生成檢索結合
2 1 3 檢索增強與傳統生成模型的區別
2 2 為何需要對傳統大模型進行檢索增強
2 2 1 預訓練大模型的瓶頸
2 2 2 RAG在實時信息處理中的優勢
2 3 檢索增強核心:預訓練大模型
2 3 1 Transformer架構的崛起:語言模型背後的核心引擎
2 3 2 從BERT到GPT-4:大模型發展的重要里程碑
2 4 本章小結
2 5 思考題
第3章 RAG模型的工作原理
3 1 檢索模塊與生成模塊
3 1 1 檢索模塊的核心功能與數據流
3 1 2 生成模塊在內容創建中的作用
3 1 3 檢索與生成的協同工作機制
3 2 向量檢索:將文本轉換為向量
3 2 1 文本嵌入的基本原理與技術
3 2 2 高效向量檢索:從相似度到索引優化
3 2 3 向量檢索在RAG中的實際應用
3 3 RAG開發中常用的生成模型簡介
3 3 1 GPT家族:從GPT-2到GPT-4的演進
3 3 2 BERT與T5:理解與生成的跨模型應用
3 4 本章小結
3 5 思考題
第4章 搭建一個簡單的RAG系統
4 1 創建小型向量資料庫
4 1 1 數據準備與預處理:搭建資料庫的第一步
4 1 2 嵌入生成與存儲:從文本到向量的轉換
4 1 3 使用FAISS構建檢索索引:實現高效查詢
4 2 利用公開模型實現簡單的問答系統
4 2 1 載入預訓練模型:選擇合適的生成模型
4 2 2 檢索與生成模塊的集成:構建問答流程
4 2 3 測試與優化:提升回答的準確性和一致性
4 3 本章小結
4 4 思考題
第5章 數據向量化與FAISS開發
5 1 什麼是向量檢索:原理與常用算法
5 1 1 向量檢索的基本概念:從相似性到距離度量
5 1 2 常用的向量檢索算法:線性搜索與近似最近鄰
5 1 3 向量檢索在RAG中的應用:增強上下文匹配
5 2 使用FAISS構建高效的向量檢索系統
5 2 1 FAISS索引結構解析:平面索引、倒排索引與產品量化
5 2 2 構建和訓練FAISS索引:提高檢索速度和準確性
5 2 3 FAISS在大規模數據中的優化策略:多級索引與分片
5 3 數據的向量化:Embedding的生成
5 3 1 嵌入生成模型選擇:如何匹配檢索任務需求
5 3 2 文本嵌入的生成與存儲:從編碼到持久化
5 4 本章小結
5 5 思考題
第6章 文本檢索增強與上下文構建
6 1 如何讓生成模型「理解」檢索到的內容
6 1 1 檢索與生成的無縫銜接:內容重構與語義理解
6 1 2 語義相似度與匹配:提升生成的準確性
6 1 3 從檢索到生成的優化路徑:模型理解的增強
6 2 上下文的構建與傳遞
6 2 1 構建有效的上下文:信息篩選與組織策略
6 2 2 多步上下文傳遞:保持生成內容的連貫性
6 2 3 上下文優化技巧:減少冗餘與增加相關性
6 3 多輪對話與複雜生成任務的實現
6 3 1 多輪交互的構建:讓生成模型模擬人類對話
6 3 2 長對話與上下文管理:模型記憶的實現方法
6 3 3 複雜生成任務分解:如何逐步實現多步驟生成
6 4 本章小結
6 5 思考題
第7章 構建檢索向量資料庫
7 1 數據的準備與清洗
7 1 1 數據質量提升:數據清洗與規範化流程
7 1 2 數據標註與分類:構建高效檢索的基礎
7 2 如何創建和管理向量資料庫
7 2 1 向量資料庫的構建步驟:從嵌入到存儲
7 2 2 高效管理:向量索引與檢索優化
7 3 本章小結
7 4 思考題
第8章 針對延遲與緩存的模型性能調優
8 1 調整生成與檢索模塊的協同參數
8 1 1 生成與檢索的平衡:優化參數的核心原則
8 1 2 動態參數調節:提升響應質量與精度
8 2 縮短RAG系統的響應時間
8 2 1 延遲分析與瓶頸定位:加速響應的第一步
8 2 2 緩存與并行處理策略:實現高效RAG系統
8 3 本章小結
8 4 思考題
第9章 企業文檔問答系統的開發
9 1 需
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。