內容簡介
本書是一本系統講解DeepSeek源碼及其核心實現原理的技術指南,內容覆蓋了從基礎概念到高級應用的全流程知識。全書共7章,結構層層遞進。第1章對DeepSeek進行了全面概述,幫助讀者構建對DeepSeek系統的整體認知。第2章聚焦于環境搭建、代碼獲取與模型部署接入,為後續深入研究提供基礎。第3章深入探討了MoE(混合專家模型)的基本原理、功能模塊與優化技術。第4章詳細解析了DeepSeek-V3模型的架構知識,並通過測試驗證展示了系統的實際效果。第5章圍繞Transformer多模態大模型展開,介紹了Janus系列架構、核心技術及工具模塊。第6章針對高解析度圖像場景,探討了結合MoE、細粒度特徵提取與視覺/語言適配器的多模態模型的知識。第7章聚焦DeepSeek-R1推理大模型,展示了DeepSeek在推理性能與自我進化方面的前沿探索。 本書適合人工智能工程師、深度學習研究者、AI產品開發人員及高校師生閱讀。無論您是希望夯實開源模型基礎,還是尋找前沿實戰案例,本書都將為您提供全面而深入的參考與指導。作者簡介
薛棟,德國慕尼黑工業大學工學博士,華東理工大學副教授,上海「浦江人才計劃」獲得者。曾於荷蘭格羅寧根大學、德國卡爾斯魯厄理工大學從事教學和研究工作。長期從事基於大數據和人工智能的控制與優化方向研究,近年來以第一作者或通訊作者在IEEE TAC、IEEE TSP等發表高水平論文20餘篇,主持國家自然科學基金面上項目、上海市人才計劃項目、企業科研攻關項目等多項課題。目錄
第1章 DeepSeek概述