內容簡介
本書是系統講解DeepSeek開發的技術指南,傳授大家開發DeepSeek模型的基礎知識。旨在幫助讀者深入理解DeepSeek的工作機制,並掌握其在大規模預訓練、推理優化及應用開發中的關鍵技術。 全書共10章,依次介紹文本預處理、特徵提取、文本分類與情感分析、語言的生成、機器翻譯、DeepSeek的核心Transformer模型、多模態模型的架構和訓練、預訓練模型的訓練與微調、DeepSeekAPI應用開發實戰,以及基於DeepSeek實現的仿ManusAgent系統。 本書不僅適合對大模型感興趣的技術人員閱讀,也適合人工智能研究者、開發者及行業從業者等閱讀。作者簡介
薛棟,德國慕尼黑工業大學工學博士,華東理工大學副教授,上海「浦江人才計劃」獲得者。曾於荷蘭格羅寧根大學、德國卡爾斯魯厄理工大學從事教學和研究工作。長期從事基於大數據和人工智能的控制與優化方向研究,近年來以第一作者或通訊作者在IEEE TAC、IEEE TSP等發表高水平論文20餘篇,主持國家自然科學基金面上項目、上海市人才計劃項目、企業科研攻關項目等多項課題。目錄
第1章 明月松間照,清泉石上流:文本預處理