內容簡介
本書全面深入地探討了AI生成大模型在多個領域的應用,從AI的歷史探源、生成式模型在不同領域的應用(文本、圖片、聲樂、視頻及多模態模型),到大型語言模型(如GPT)的運作機制、預訓練、可擴展架構及其適應性。通過詳細介紹LangChain的概念、應用、安裝方法及如何利用LangChain進行軟體開發和數據科學研究,本書為讀者提供了一個關於AI生成大模型應用的全景視圖。 本書共11章,覆蓋了AI生成大模型的理論基礎、LangChain的入門與進階使用、LangChain在軟體開發和數據科學中的應用及生成式AI的未來展望等方面。第1~3章介紹AI生成大模型的基礎知識,如AI歷史、生成式模型在不同領域的應用,以及大型語言模型,如GPT的基礎和LangChain的初識與入門。第4~6章深入LangChain的進階使用,探討Agent構建、文檔查詢、聊天機器人開發,提供實戰案例和技術細節。第7~9章聚焦LangChain在軟體開發和數據科學的應用及定製LLM輸出的策略,介紹編程、自動化軟體開發、數據探索技術方法及LLM輸出優化。第10章和第11章討論LLM在生產環境的應用、監控、回調處理,以及生成式AI的未來展望,包括其潛力、社會影響和挑戰。本書旨在為讀者提供LangChain從入門到進階的全面知識,適合不同背景的讀者深入學習和應用。 本書特色在於其理論與實踐相結合的方法論,適合對AI生成大模型感興趣的學生、研究人員和軟體開發者閱讀。書中不僅詳細介紹了AI生成大模型的基礎知識和前沿技術,還提供了豐富的實踐指導和案例分析。此外,配套資源豐富,包括示例代碼、工具安裝指南和案例研究,極大地增強了本書的實用性和指導性。無論是AI領域的新手還是有經驗的開發者都能從中獲得必要的知識和靈感。作者簡介
陸夢陽,目前任職於世界500強中排名第26位的思科公司,擔任客戶網絡系統數字化與自動化解決方案的主導工程師,成功領導了多項針對全球500強企業的網絡架構自動化項目,涵蓋台積電、香奈兒、SAP等知名企業,專註於思科DNA Center AI智能網絡日誌分析的研究方向。在央企外派至肯亞期間,主導與當地AI數據標註公司Sama的合作,共同開發了口罩檢測及社交距離監測系統,有效地管理了建築施工項目中的疫情風險。Sama公司作為OpenAI公司的重要數據標註供應商,為ChatGPT模型提供了大量的數據標註服務。作為項目負責人,與Sama公司的合作項目提供了參与超級大語言模型數據訓練的寶貴經驗和視角。此外,發表了《基於Transformer模型的安全事故分類研究》等學術論文,體現了在該領域的深入研究與貢獻。目錄
第1章 什麼是AI生成大模型