編輯推薦
作者經驗豐富:兩位作者均是資深的大模型技術專家,是知名項目AutoGPT的代碼貢獻者和百度飛槳PPDE的技術專家,在RAG領域有深厚積累。 零基礎快入門:本書不需要讀者有任何大模型和RAG的基礎,從RAG技術的理論基礎、架構設計到實戰部署,全方位覆蓋從入門到落地的完整知識體系。 融合前沿理論與實踐:緊跟RAG領域的前沿技術發展,以及RAG在企業的各種新應用,為讀者提供有價值的參考方案。 實戰性強:包含大量案例和示例代碼,手把手教讀者構建完整可落地的RAG解決方案。 配套資源豐富:不僅提供GitHub倉庫,及時更新書中代碼和RAG領域的新近發展情況,作者還提供社群服務,親自為讀者答疑。內容簡介
這是一本面向企業級AI應用開發者和決策者的RAG技術實戰指南,全面覆蓋了從基礎理論到高級優化的各個環節。本書採用循序漸進的講解方式,配以豐富的圖表和代碼示例,為讀者提供了一條完整的學習路徑,幫助讀者快速掌握RAG技術的精髓。 本書共10章,分為四部分。 第一部分介紹了RAG技術的定義、發展背景、核心組成以及落地面臨的挑戰,同時深入探討了RAG技術背後的原理,包括嵌入技術、數據索引與檢索,以及大語言模型的應用。 第二部分詳細講解了RAG應用的各個環節,從數據準備與處理,到檢索環節的優化,再到生成環節的技巧。 第三部分主要介紹了RAG系統的高級優化策略、常見框架實現原理與性能評估方法。針對高級優化策略,介紹了索引構建、預檢索、檢索、生成預處理和生成五個環節;針對常見框架,介紹了自省式RAG、自適應RAG、基於樹結構索引的RAG、糾錯性RAG等;針對評估方法,從評估指標和評估框架兩個方面介紹了檢索環節和生成環節的各種衡量指標的特點。 第四部分首先通過具體的企業級應用案例和行業特定解決方案,展示了RAG技術在文檔生成、知識庫檢索、客戶服務等領域的實際應用,以及在金融、醫療、法律等特定行業的落地實踐。然後展望了RAG技術的未來發展趨勢,如長上下文對RAG的影響、多模態RAG的應用,以及嵌入模型與大模型語義空間融合等前沿話題,最後對RAG落地挑戰進行了總結。作者簡介
李多多(@莫爾索),在大模型應用落地方面有豐富的經驗,為知名項目AutoGPT、LangChain框架等貢獻過代碼,撰有開源電子書《LLM應用開發實踐》。「莫爾索隨筆」公眾號主理人,致力於大模型技術普及。目錄
前言