內容簡介
能夠模仿人類語言智能與思維,具有世界一般性知識的ChatGPT,開啟了通用人工智能的新時代,正成為引爆第四次工業革命的火種。本書是第一本體系化介紹ChatGPT基本原理與核心算法的教材及專業圖書。全書共分5章:第1章為人工神經網絡基礎;第2章詳細剖析了Transformer及其緣起,分析了視覺領域的Transformer算法;第3章綜述了各種大型語言模型框架,分享了創建GPT系列模型的思想之旅;第4章重點介紹了ChatGPT的預訓練方法與微調算法,系統地闡述了強化學習基礎與基於人類反饋的強化學習;第5章為ChatGPT的應用,包括上下文學習提示與思維鏈提示,並討論了智能湧現。本書體系嚴謹、系統性強、邏輯嚴密、內容豐富,不僅深入淺出、圖文並茂、特色鮮明,而且具有引領性、前瞻性和思想啟迪性。 本書可作為高等院校人工智能、智能科學與技術、計算機科學與技術、大數據、自動駕駛、新一代機器人及相關專業高年級本科生與研究生教材,也可供上述專業的研究人員、算法工程師及從事AI產品研發,產業發展與決策諮詢等的工程技術人員、投資者、戰略研究者和廣大科技工作者參考。作者簡介
鄧志東,CAA會士,CCF傑出會員。清華大學計算機科學與技術系教授,博士生導師,清華大學人工智能研究院視覺智能研究中心主任。目前的主要研究方向為人工智能(深度神經網絡與大模型、深度強化學習)、自動駕駛、人形機器人。發表學術論文300餘篇。目錄
第1章 人工神經網絡基礎