內容簡介
《DeepSeek原生應用與智能體開發實踐》圍繞DeepSeek大模型應用開發展開,深度融合技術創新與工程實踐,內容覆蓋大模型應用開發(在線調用、提示詞、推理、Agent、工具調用、MCP、微調、蒸餾、後訓練、RAG)技術棧及其案例。書中原理與案例相融合,注重培養讀者的大模型原生應用與智能體開發能力,並構建從理論到落地的完整知識體系。《DeepSeek原生應用與智能體開發實踐》配套示例源碼、PPT課件、配圖PDF文件、讀者微信交流群。
《DeepSeek原生應用與智能體開發實踐》共分16章,內容包括大模型時代、DeepSeek開發環境配置與開放API使用、提示工程與DeepSeek提示庫、思維鏈與DeepSeek推理模型、基於DeepSeek的Agent開發詳解、DeepSeek的Function Calling與MCP應用實戰、大模型驅動的即時金融信息採集與分析平臺、KV Cache加持的推理加速、MLA注意力機制、MoE專家模型、MTP與多組件優化、大模型微調技術與應用、大模型蒸餾技術與應用、後訓練算法GRPO詳解與實戰、基於後訓練的智能醫療問診實戰,以及基於A2A、MCP與RAG的多Agent跨境電商智能客服實戰。
《DeepSeek原生應用與智能體開發實踐》既適合DeepSeek開發初學者、大模型原生應用與智能體開發人員、模型優化與工程化工程師、大模型研究人員、行業AI解決方案提供商,也適合高等院校及高職高專院校學習人工智能大模型的學生。
作者簡介
王曉華,高校計算機專業講師,研究方向為雲計算、大數據與人工智能。其著作包括《DeepSeek大模型高性能核心技術與多模態融合開發》《深入探索Mamba模型架構與應用》《PyTorch深度學習與計算機視覺實踐》《PyTorch語音識別實戰》《ChatGLM3大模型本地化部署、應用開發與微調》《從零開始大模型開發與微調:基於PyTorch與ChatGLM》《PyTorch 2 0深度學習從零開始學》《TensorFlow深度學習應用實踐》《OpenCV+TensorFlow深度學習與計算機視覺實戰》《TensorFlow語音識別實戰》《TensorFlow 2 0卷積神經網絡實戰》《深度學習的數學原理與實現》。
目錄
目 錄
第 1 章 大模型時代 1
1 1 大模型的誕生與發展 1
1 1 1 大語言模型發展簡史與概念 2
1 1 2 大語言模型的生成策略 3
1 2 大語言模型發展的里程碑 4
1 2 1 注意力機制是大模型發展的里程碑 4
1 2 2 注意力機制的關鍵創新 5
1 2 3 注意力機制對語言建模的影響 7
1 2 4 大模型中的湧現與Scaling Law 10
1 2 5 大模型的訓練方法SFT與RLHF 12
1 3 大語言模型發展的”DeepSeek時刻” 13
1 3 1 重塑世界AI格局的DeepSeek-V3 14
1 3 2 推理能力大飛躍的DeepSeek-R1 16
1 4 大模型的應用與展望 18
1 4 1 大模型的實際應用 18
1 4 2 大模型發展面臨的展望 19
1 5 本章 小結 20
第 2 章 DeepSeek開發環境配置與開放API使用 21
2 1 安裝Python開發環境 21
2 1 1 Miniconda的下載與安裝 21
2 1 2 PyCharm的下載與安裝 24
2 2 安裝DeepSeek開發框架 28
2 2 1 不同顯卡與運行庫的選擇 28
2 2 2 PyTorch GPU版本的安裝 28
2 2 3 測試PyTorch和CUDA安裝信息 30
2 3 在線DeepSeek應用配置詳解 31
2 3 1 DeepSeek簡介與免費使用 32
2 3 2 帶有特定格式的DeepSeek在線調用 33
2 3 3 帶有約束的DeepSeek在線調用 35
2 3 4 將DeepSeek與PyCharm相連 37
2 4 本章 小結 39
第 3 章 提示工程與DeepSeek提示庫 40
3 1 提示工程Prompt詳解 40
3 1 1 什麼是提示工程 41
3 1 2 提示工程的關鍵要素與DeepSeek配置 41
3 1 3 DeepSeek提示工程化寫作技巧與示例 43
3 1 4 系統、上下文和角色提示的進階應用 44
3 2 DeepSeek中的提示庫 46
3 2 1 DeepSeek中提示庫介紹與基本使用 46
3 2 2 帶有系統提示的提示對話生成 50
3 3 本章 小結 51
第 4 章 思維鏈與DeepSeek推理模型 52
4 1 思維鏈詳解 52
4 1 1 思維鏈應用場景 53
4 1 2 思維鏈的定義與分類 54
4 2 基於思維鏈的DeepSeek推理模型實戰 55
4 2 1 通過Prompt提示構建思維鏈 56
4 2 2 DeepSeek-Reasoner推理模型實戰 58
4 3 本章 小結 60
第 5 章 基於DeepSeek的Agent開發詳解 61
5 1 Agent開發概述 62
5 1 1 Agent的定義與核心機制 62
5 1 2 API Agent與GUI Agent 63
5 2 基於DeepSeek的美妝GUI Agent實踐 65
5 2 1 GUI Agent庫的安裝與使用 66
5 2 2 使用DeepSeek自動化獲取網頁端天氣信息 68
5 2 3 根據天氣信息給出美妝建議 70
5 3 基於DeepSeek的體重管理API Agent實踐 72
5 3 1 API Agent的註冊與使用 73
5 3 2 實現卡路里計算與運動建議的功能 76
5 4 本章 小結 77
第 6 章 DeepSeek的Function Calling與MCP應用實戰 78
6 1 DeepSeek自帶的Function Calling詳解 78
6 1 1 Python使用工具的基本原理 79
6 1 2 DeepSeek工具使用詳解 80
6 1 3 DeepSeek工具箱的使用 83
6 1 4 DeepSeek工具調用判定依據 89
6 2 給大模型插上翅膀的MCP協議詳解 93
6 2 1 MCP協議目的、功能與架構詳解 94
6 2 2 MCP實戰1:本地工具服務端搭建 96
6 2 3 MCP實戰2:本地客戶端搭建與使用 98
6 3 在線MCP服務器的搭建與使用實戰 102
6 3 1 在線MCP服務器搭建 102
6 3 2 在線MCP服務的連接和使用 103
6 4 本章 小結 105
第 7 章 大模型驅動的即時金融信息採集與分析平臺 106
7 1 網絡爬取工具Crawl4AI詳解 106
7 1 1 大模型傳遞數據的方式 107
7 1 2 服務於大模型的Crawl4AI 107
7 1 3 Crawl4AI的安裝與基本使用 108
7 2 DeepSeek驅動的即時金融信息採集與分析平臺實戰 109
7 2 1 使用Crawl4AI爬取金融網站 110
7 2 2 對鏈接內容進行解析 111
7 2 3 使用DeepSeek抽取和分析金融信息 113
7 2 4 實現DeepSeek驅動的即時金融信息採集與分析平臺 115
7 2 5 將DeepSeek設置不同的人設並對金融信息進行分析 115
7 3 本章 小結 116
第 8 章 DeepSeek核心技術1: KV Cache加持的推理加速 117
8 1 自回歸生成模型中的資源計算 117
8 1 1 自回歸模型的計算量 118
8 1 2 自回歸模型的緩存優化 118
8 2 自回歸生成模型中的推理加速詳解 120
8 2 1 模型推理中的”貪心生成”與”採樣生成” 121
8 2 2 模型推理過程中的冗餘計算問題解析 122
8 2 3 初識模型推理中的KV Cache與代碼實現 124
8 3 減少空間佔用的自回歸模型代碼實現與詳解 126
8 3 1 經典自回歸模型詳解 126
8 3 2 能夠減少空間佔用的自回歸模型代碼完整實現 128
8 3 3 緩存使用與傳遞過程詳解 132
8 4 減少空間佔用的生成模型實戰與推理資源消耗量化對比 134
8 4 1 模型參數配置與訓練數據的準備 134
8 4 2 帶有緩存的生成模型訓練 136
8 4 3 未運行緩存的生成模型推理資源量化展示 137
8 4 4 在緩存的生成模型推理資源量化展示 139
8 4 5 使用細精度修正模型輸出 140
8 5 本章 小結 140
第 9 章 DeepSeek核心技術2:MLA注意力機制 141
9 1 從推理角度詳解MLA注意力模型與代碼實現 142
9 1 1 大模型的推理過程 142
9 1 2 通用大模型的顯存佔用量化計算 143
9 1 3 手把手MLA注意力公式的總體推導 145
9 2 從緩存角度詳解MLA注意力模型與代碼實現 146
9 2 1 優化的MLA模型實現1:壓縮低秩空間 147
9 2 2 優化的MLA模型實現2:核心注意力矩陣計算 148
9 2 3 優化的MLA模型實現3:對顯存KV Cache部分的壓縮 149
9 2 4 帶有緩存的MLA注意力模型完整實現 149
9 3 MLA注意力模型的完整補充講解 152
9 3 1 調參、記憶力以及矩陣計算優化 152
9 3 2 MLA、GQA以及MQA差異詳解 156
9 4 本章 小結 157
第 10 章 DeepSeek核心技術3:MoE模型 158
10 1 MoE架構 158
10 1 1 MoE模型的基本結構 159
10 1 2 MoE模型中的”專家”與”調控”代碼實現 160
10 1 3 使用MoE模型還是經典的前饋層 163
10 2 基於MoE模型的情感分類實戰 164
10 2 1 基於MoE模型的評論情感分類實戰 164
10 2 2 MoE模型中負載平衡的實現 167
10 3 加載MoE架構的注意力模型 169
10 3 1 注意力機制中的前饋層不足 170
10 3 2 MoE可作為前饋層的替代 173
10 3 3 結合MoE的注意力機制 175
10 4 基於MoE與自注意力的圖像分類 175
10 4 1 基於注意力機制的ViT模型 176
10 4 2 Patch Embedding與Position Embedding 177
10 4 3 可視化的Vision-MoE的詳解 179
10 4 4 V-Mo