內容簡介
大模型作為人工智能技術的重要發展方向,逐漸成為未來科技發展的重要方向之一。基於此,本書重點介紹與大模型相關的基礎知識、原理與技術。本書內容包括深度學習基礎、自然語言處理、大模型網絡結構、大模型訓練與優化、大模型微調及相關應用案例等。全書強調內容的科學性與系統性,從大模型歷史發展脈絡、理論基礎、構建方法到應用場景,循序漸進地全面講解大模型技術。本書聚焦于大模型在不同領域的擴展應用,提供了應用案例的全方位學習路徑,旨在培養和提升學生的實踐和創造能力。每章都提供了相應的習題,供學生練習和鞏固知識。同時,本書通過介紹開源框架「計圖」、華為晶元、航空航天裝備製造等知識,可以讓學生了解更多國產技術。 本書適合作為科研院所和本科院校計算機、人工智能、機械製造與自動化等相關專業的教材,也可以作為高職高專院校的教學參考書。作者簡介
魏明強 南京航空航天大學教授、博士生導師、腦機智能技術教育部重點實驗室副主任,國家自然科學基金優秀青年基金獲得者,江蘇省計算機學會青年科技獎和航空航天學會青年科學家獎獲得者,第14屆中國計算機圖形學大會最佳論文一等獎獲得者。博士畢業於香港中文大學並獲最佳博士畢業論文獎(2014)。目前為多個期刊的編委/客座編輯,如ACM TOMM、IEEETMM、計算機輔助設計與圖形學學報。近年來,圍繞大飛機三維掃描與測量、幾何深度學習和三維視覺等研究方向,主持國家級和省部級項目數十項;在CFF A類期刊和會議上發表學術論文150餘篇,如IEEE TPAMI、TVCG、TIP、SIGGRAPH,IJCV、CVPR、ICCV,相關技術用在國家重點型號工程。目錄
第1章 緒論