*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202503*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:DeepSeek原理與項目實戰-大模型部署 微調與應用開發
ISBN:9787115665584
出版社:人民郵電
著編譯者:未來智能實驗室 代晶
頁數:310
所在地:中國大陸 *此為代購商品書號:1721049
可大量預訂,請先連絡。【台灣高等教育出版社簡體書】 DeepSeek原理與項目實戰-大模型部署 微調與應用開發 787115665584 未來智能實驗室 代晶
內容簡介
DeepSeek是一種基於Transformer架構的生成式AI(Artificial Intelligence)大模型,融合了MoE架構、混合精度訓練、分散式優化等先進技術,具備強大的文本生成、多模態處理和任務定製化能力。本書系統性地介紹了開源大模型DeepSeek-V3的核心技術及其在實際開發中的深度應用。 全書分三部分共12章,涵蓋理論解析、技術實現和應用實踐。第一部分從理論入手,詳細解析了Transformer與注意力機制、DeepSeek-V3的核心架構與訓練技術等內容,並探討了Scaling Laws及其在模型優化中的應用。第二部分聚焦于大模型初步體驗、開放平台與API開發、對話生成與代碼補全的實現,以及函數回調與緩存優化(Visual Studio Code),幫助讀者快速掌握關鍵技術的基礎理論和落地實踐。第三部分則通過實際案例剖析DeepSeek在Chat類客戶端、智能AI助理、VSCode編程插件等多領域中的實用集成開發,展示了開源大模型技術在工業與商業場景中的全面應用。 本書通過深度講解與實用案例相結合的方式,幫助讀者理解DeepSeek大模型從原理到開發的完整流程,學習新技術的實現方法與優化策略,全面提升在大模型領域的理論素養與開發能力。本書適合生成式AI技術研究者、軟體開發工程師、數據科學家,以及希望快速掌握大模型技術並將其應用於實際場景的AI技術愛好者和高校師生閱讀。
目錄
第一部分 生成式AI的基礎與技術架構
第1章 Transformer與注意力機制的核心原理
1 1 Transformer的基本結構
1 1 1 Encoder-Decoder架構
1 1 2 Self-Attention與Multi-Head機制
1 1 3 殘差連接與LayerNormalization
1 2 注意力機制的核心原理
1 2 1 點積注意力與加性注意力的對比
1 2 2 Softmax歸一化原理
1 2 3 注意力矩陣的稀疏性與加速優化
1 3 Transformer的擴展與優化
1 3 1 動態注意力的實現
1 3 2 Long-RangeAttention與Sparse Attention
1 3 3 多樣化位置編碼
1 4 上下文窗口
1 4 1 上下文窗口擴展
1 4 2 內存與計算複雜度的平衡
1 4 3 DeepSeek-V3在上下文窗口方面的優化
1 5 訓練成本與計算效率的平衡
1 5 1 參數量與計算需求的增長趨勢
1 5 2 GPU計算架構在Transformer中的應用
1 5 3 DeepSeek-V3如何降低訓練成本
1 6 本章小結
第2章 DeepSeek-V3核心架構及其訓練技術詳解
2 1 MoE架構及其核心概念
2 1 1 Mixture of Experts(MoE)簡介
2 1 2 Sigmoid路由的工作機制
2 1 3 基於MoE的DeepSeek-V3架構設計
2 2 FP8混合精度訓練的優勢
2 2 1 混合精度計算的基本原理
2 2 2 FP8在大模型訓練中的應用
2 2 3 基於FP8的DeepSeek-V3性能提升策略
2 3 dualpipe算法與通信優化
2 3 1 Dualpipe雙管道處理算法
2 3 2 All-to-All跨節點通信機制
2 3 3 Infiniband與NVLink的帶寬優化
2 4 大模型的分散式訓練
2 4 1 數據并行與模型并行的權衡
2 4 2 DeepSeek-V3的分散式訓練架構
2 4 3 動態學習率調度器的設計與優化
2 4 4 無輔助損失的負載均衡策略
2 4 5 多令牌預測訓練目標
2 5 緩存機制與Token
2 5 1 緩存命中與未命中的基本概念
2 5 2 Token的定義與編碼過程
2 5 3 DeepSeek-V3的高效緩存機制
2 6 DeepSeek系列模型
2 6 1 DeepSeekLLM
2 6 2 DeepSeekCoder
2 6 3 DeepSeekMath
2 6 4 DeepSeekVL
2 6 5 DeepSeekV
2 6 6 DeepSeekCoderV
2 6 7 DeepSeek
2 7 本章小結
第3章 基於DeepSeek-V3大模型的開發導論
3 1 大模型應用場景
3 1 1 文本生成與摘要
3 1 2 問答系統與對話生成
3 1 3 多語言編程與代碼生成
3 2 DeepSeek-V3的優勢與應用方向
3 2 1 在不同領域的實際表現
3 2 2 多語言編程能力(基於Aider測評案例)
3 2 3 代碼與數學任務的應用探索
3 3 ScalingLaws研究與實踐
3 3 1 模型規模與性能的關係
3 3 2 小模型上的ScalingLaws實驗結果
3 4 模型部署與集成
3 4 1 API調用與實時生成
3 4 2 本地化部署
3 4 3 性能優化策略
3 5 開發中的常見問題與解決方案
3 5 1 輸入設計與生成控制
3 5 2 模型偏差與穩健性問題
3 5 3 關於DeepSeek-V3特定問題的應對技巧
3 6 本章小結
第二部分 生成式AI的專業應用與Prompt設計
第4章 DeepSeek-V3大模型初體驗
4 1 對話與語義理解能力
4 1 1 單輪對話與多輪對話
4 1 2 上下文交互
4 2 數學推理能力
4 2 1 常規數學題目評估
4 2 2 複雜難題理解與推理
4 3 輔助編程能力
4 3 1 輔助算法開發
4 3 2 軟體開發
4 4 本章小結
第5章 DeepSeek開放平台與API開發詳解
5 1 DeepSeek開放平台簡介
5 1 1 平台核心模塊與服務概述
5 1 2 開放生態中的關鍵角色與協作
5 2 DeepSeekAPI的基礎操作與API介面詳解
5 2 1 API調用的認證機制與請求結構
5 2 2 常用介面的功能解析與示例
5 3 API性能優化與安全策略
5 3 1 降低延遲的性能優化技巧
5 3 2 數據保護與調用許可權管理
5 4 本章小結
第6章 對話生成、代碼補全與定製化模型開發
6 1 對話生成的基本原理與實現
6 1 1 對話模型的輸入輸出設計
6 1 2 自然語言交互中的上下文管理
6 2 代碼補全的實現邏輯與優化
6 2 1 模型對編程語言的適配策略
6 2 2 深度補全功能的性能優化
6 3 基於DeepSeek的定製化模型開發
6 3 1 模型微調與任務特化技術
6 3 2 定製化對話與補全模型的案例解析
6 3 3 綜合案例:基於DeepSeek-V3模型的代碼生成與任務特化
6 4 本章小結
第7章 對話前綴續寫、FIM與JSON輸出開發詳解
7 1 對話前綴續寫的技術原理與應用
7 1 1 前綴建模的設計邏輯與實現方案
7 1 2 多樣化續寫風格的控制與實現
7 2 Fill-in-the-Middle(FIM)生成模式解析
7 2 1 FIM任務定義與生成流程
7 2 2 DeepSeek對FIM任務的優化技術
7 3 JSON格式輸出的設計與生成邏輯
7 3 1 結構化
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。