大模型應用開發-RAG實戰課 黃佳 9787115671851 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:人民郵電
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$635
商品編號: 9787115671851
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202505*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大模型應用開發-RAG實戰課
ISBN:9787115671851
出版社:人民郵電
著編譯者:黃佳
頁數:337
所在地:中國大陸 *此為代購商品
書號:1733833
可大量預訂,請先連絡。

內容簡介

在大模型逐漸成為智能系統核心引擎的今天,檢索增強生成(RAG)技術為解決模型的知識盲區以及提升響應準確性提供了關鍵性的解決方案。本書圍繞完整的RAG系統生命周期,系統地拆解其架構設計與實現路徑,助力開發者和企業構建實用、可控且可優化的智能問答系統。 首先,本書以「數據導入—文本分塊—信息嵌入—向量存儲」為主線,詳細闡述了從多源文檔載入到結構化預處理的全流程,並深入解析了嵌入模型的選型、微調策略及多模態支持;其次,從檢索前的查詢構建、查詢翻譯、查詢路由、索引優化,到檢索后的重排與壓縮,全面講解了提高召回質量和內容相關性的方法;接下來,介紹了多種生成方式及RAG系統的評估框架;最後,展示了複雜RAG範式的新進展,包括GraphRAG、Modular RAG、Agentic RAG和Multi-Modal RAG的構建路徑。 本書適合AI研發工程師、企業技術負責人、知識管理從業者以及對RAG系統構建感興趣的高校師生閱讀。無論你是希望快速搭建RAG系統,還是致力於深入優化檢索性能,亦或是探索下一代AI系統架構,本書都提供了實用的操作方法與理論支持。

作者簡介

黃佳,人稱咖哥,埃森哲公司資深顧問,在IT界耕耘近二十載,自詡為一朵有「後浪」心態的「前浪」。為人謙虛,好學,有時也好為人師。曾撰寫一系列SAPERP書籍,啟蒙了大批中國早期ABAP技術人才。近年來投身數據科學、人工智能及雲計算領域,願將自己的所學所感與大家分享。

目錄

楔子 鬧市中的古剎
開篇 RAG三問
一問 從實際項目展示到底何為RAG
文檔的導入和解析
文檔的分塊
文本塊的嵌入
向量資料庫的選擇
文本塊的檢索
回答的生成
二問 如何快速搭建RAG系統
使用框架:LangChain的RAG實現
使用框架:通過LCEL鏈進行重構
使用框架:通過LangGraph進行重構
不使用框架:自選Embedding模型、向量資料庫和大模型
使用coze、Dify、FastGPT等可視化工具
三問 從何處入手優化RAG系統
第1章 數據導入
1 1 用數據載入器讀取簡單文本
1 1 1 藉助LangChain讀取TXT文件,以生成Document對象
1 1 2 LangChain中的數據載入器
1 1 3 用LangChain讀取

目錄

中的所有文件
1 1 4 用LlamaIndex讀取

目錄

中的所有文檔
1 1 5 用LlamaHub連接Reader並讀取資料庫條目
1 1 6 用Unstructured工具讀取各種類型的文檔
1 2 用JSON載入器解析特定元素
1 3 用UnstructuredLoader讀取圖片中的文字
1 3 1 讀取圖片中的文字
1 3 2 讀取PPT中的文字
1 4 用大模型整體解析圖文
1 5 導入CSV格式的表格數據
1 5 1 使用CSVLoader導入數據
1 5 2 比較CSVLoader和UnstructuredCSVLoader
1 6 網頁文檔的爬取和解析
1 6 1 用WebBaseLoader快速解析網頁
1 6 2 用UnstructuredLoader細粒度解析網頁
1 7 Markdown文件標題和結構
1 8 PDF文件的文本格式、布局識別及表格解析
1 8 1 PDF文件載入工具概述
1 8 2 用PyPDFLoader進行簡單文本提取
1 8 3 用Marker工具把PDF文檔轉換為Markdown格式
1 8 4 用UnstructuredLoader進行結構化解析
1 8 5 用PyMuPDF和坐標信息可視化布局
1 8 6 用UnstructuredLoader解析PDF頁面中的表格
1 8 7 用ParentID整合同一標題下的內容
1 9 小結
第2章 文本分塊
2 1 為什麼分塊非常重要
2 1 1 上下文窗口限制了塊最大長度
2 1 2 分塊大小對檢索精度的影響
2 1 3 分塊大小對生成質量的影響
2 1 4 不同的分塊策略
2 1 5 用ChunkViz工具可視化分塊
2 2 按固定字元數分塊
2 2 1 LangChain中的CharacterTextSplitter工具
2 2 2 在LlamaIndex中設置塊大小參數
2 3 遞歸分塊
2 4 基於特定格式(如代碼)分塊
2 5 基於文件結構或語義分塊
2 5 1 使用Unstructured工具基於文檔結構分塊
2 5 2 使用LlamaIndex的SemanticSplitterNodeParser進行語義分塊
2 6 與分塊相關的高級索引構建技巧
2 6 1 帶滑動窗口的句子切分
2 6 2 分塊時混合生成父子文本塊
2 6 3 分塊時為文本塊創建元數據
2 6 4 在分塊時形成有級別的索引
2 7 小結
第3章 嵌入生成
3 1 嵌入是對外部信息的編碼
3 2 從早期詞嵌入模型到大模型嵌入
3 2 1 早期詞嵌入模型
3 2 2 上下文相關的詞嵌入模型
3 2 3 句子嵌入模型和SentenceTransformers框架
3 2 4 多語言嵌入模型
3 2 5 圖像和音頻嵌入模型
3 2 6 圖像與文本聯合嵌入模型
3 2 7 圖嵌入模型和知識圖譜嵌入模型
3 2 8 大模型時代的嵌入模型
3 3 現代嵌入模型:OpenAI、Jina、Cohere、Voyage
3 3 1 用OpenAI的text-embedding-3-small進行產品推薦
3 3 2 用jina-embeddings-v3模型進行跨語言數據集聚類
3 3 3 MTEB:海量文本嵌入基準測試
3 3 4 各種嵌入模型的比較及選型考量
3 4 稀疏嵌入、密集嵌入和BM
3 4 1 利用BM25實現稀疏嵌入
3 4 2 BGE-M3模型:稀疏嵌入和密集嵌入的結合
3 5 多模態嵌入模型:Visualized_BGE
3 6 通過LangChain、LlamaIndex等框架使用嵌入模型
3 6 1 LangChain提供的嵌入介面
3 6 2 LlamaIndex提供的嵌入介面
3 6 3 通過LangChain的Caching緩存嵌入
3 7 微調嵌入模型
3 8 小結
第4章 向量存儲
4 1 向量究竟是如何被存儲的
4 1 1 從LlamaIndex的設計看簡單的向量索引
4 1 2 向量資料庫的組件
4 2 向量資料庫中的索引
4 2 1 FLAT
4 2 2 IVF
4 2 3 量化索引
4 2 4 圖索引
4 2 5 哈希技術
4 2 6 向量的檢索(相似度度量)
4 3 主流向量資料庫
4 3 1 Milvus
4 3 2 Weaviate
4 3 3 Qdrant
4 3 4 Faiss
4 3 5 Pinecone
4 3 6 Chroma
4 3 7 Elasticsearch
4 3 8 PGVector
4 4 向量資料庫的選型與測評
4 4 1 向量資料庫的選型
4 4 2 向量資料庫的測評
4 5 向量資料庫中索引和搜索的設置
4 5 1 Milvus向量操作示例
4 5 2 選擇合適的索引類型
4 5 3 選擇合適的度量標準
4 5 4 在執行搜索時度量標準要與索引匹配
4
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理