內容簡介
本書深入剖析DeepSeek的核心技術,介紹了提示詞的原理與高級應用,對DeepSeek的模型架構、訓練框架,以及MoE優化、MLA、思維鏈、GRPO算法、獎勵模型等技術細節進行了探討。此外,本書對DeepSeek給人工智能行業格局帶來的影響及DeepSeek的開源貢獻進行了分析,對大模型的發展趨勢進行了展望。 本書適合人工智能研究人員、開發人員及大模型相關技術愛好者閱讀,也為關注人工智能領域技術發展的從業人員提供了參考與借鑒。作者簡介
盧菁,北京科技大學博士,北京大學博士后流動站出站。工作于騰訊、愛奇藝等知名互聯網公司,主要從事人工智能技術的應用和研發工作。主要研究方向為機器學習、自然語言處理、知識圖譜、推薦系統等,有豐富的理論和實踐經驗。目錄
第1章 技驚四座的DeepSeek