內容簡介
本書系統地介紹向量資料庫的原理、技術實現及其應用,重點分析傳統資料庫在處理高維向量數據時的局限性,並提供相應的解決方案。本書分為4個部分,共13章,內容涵蓋從理論基礎到技術實踐的多個方面,詳細討論高維向量表示中的信息丟失、嵌入空間誤差和維度詛咒等問題,結合FAISS和Milvus等主流開源工具,深入剖析向量資料庫的索引機制、搜索算法和優化策略。通過實際案例,展示向量資料庫在推薦系統、行為分析、智能診斷、語義搜索等領域的應用,並特彆強調企業級語義搜索系統的開發與部署經驗。 本書不僅提供深度的理論指導,還通過豐富的案例幫助讀者掌握如何構建高效的向量搜索引擎,適合從事搜索引擎與推薦系統開發的工程師,數據科學、人工智能及相關領域的從業者、研究人員,以及對向量資料庫與相似性搜索感興趣的讀者,也可作為培訓機構和高校相關課程的教學用書。作者簡介
梁楠,博士,畢業於北京航空航天大學,高級職稱,長期從事模式識別、機器學習、統計理論的研究與應用,負責或參与科研項目多項,專註於人工智能、大語言模型的應用與開發,對深度學習、數據分析與預測等有獨到見解。目錄
第1部分 理論基礎