內容簡介
本書從技術角度深度解析大模型的原理,從大模型的基礎概念及領域發展現狀入手,概述大模型的理論基礎,介紹OpenAI GPT、清華大學GLM、Meta Llama等主流大模型的技術原理,並從大模型參數高效微調、大模型指令微調、大模型訓練優化和大模型推理優化等多角度解析大模型背後的技術,帶領讀者全方位掌握大模型的原理和實踐方法。本書最後介紹私有大模型的構建,手把手指導讀者做技術選型並搭建自己的私有大模型。 本書適合人工智慧領域有大模型開發需求或對大模型技術感興趣的技術人員閱讀,也適合普通用戶擴展了解大模型的前沿應用。作者簡介
文亮,奇虎360公司資深演算法專家,碩士畢業於電子科技大學信息與軟體工程學院。主要研究方向有推薦系統、深度學習和信息安全,曾發表5篇相關領域的學術論文,其中3篇被EI收錄。他擁有超過5年的機器學習與推薦系統實踐經驗,作為奇虎360推薦場景的核心研發人員,主導深度學習在奇虎360信息流推薦場景的落地工作。目錄
第1章 大模型簡介