大模型原理與技術 魏明強 陳松燦 9787121488931 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:電子工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$439
商品編號: 9787121488931
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202409*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大模型原理與技術
ISBN:9787121488931
出版社:電子工業
著編譯者:魏明強 陳松燦
頁數:343
所在地:中國大陸 *此為代購商品
書號:1718945
可大量預訂,請先連絡。

內容簡介

大模型作為人工智能技術的重要發展方向,逐漸成為未來科技發展的重要方向之一。基於此,本書重點介紹與大模型相關的基礎知識、原理與技術。本書內容包括深度學習基礎、自然語言處理、大模型網絡結構、大模型訓練與優化、大模型微調及相關應用案例等。全書強調內容的科學性與系統性,從大模型歷史發展脈絡、理論基礎、構建方法到應用場景,循序漸進地全面講解大模型技術。本書聚焦于大模型在不同領域的擴展應用,提供了應用案例的全方位學習路徑,旨在培養和提升學生的實踐和創造能力。每章都提供了相應的習題,供學生練習和鞏固知識。同時,本書通過介紹開源框架「計圖」、華為晶元、航空航天裝備製造等知識,可以讓學生了解更多國產技術。 本書適合作為科研院所和本科院校計算機、人工智能、機械製造與自動化等相關專業的教材,也可以作為高職高專院校的教學參考書。

作者簡介

魏明強 南京航空航天大學教授、博士生導師、腦機智能技術教育部重點實驗室副主任,國家自然科學基金優秀青年基金獲得者,江蘇省計算機學會青年科技獎和航空航天學會青年科學家獎獲得者,第14屆中國計算機圖形學大會最佳論文一等獎獲得者。博士畢業於香港中文大學並獲最佳博士畢業論文獎(2014)。目前為多個期刊的編委/客座編輯,如ACM TOMM、IEEETMM、計算機輔助設計與圖形學學報。近年來,圍繞大飛機三維掃描與測量、幾何深度學習和三維視覺等研究方向,主持國家級和省部級項目數十項;在CFF A類期刊和會議上發表學術論文150餘篇,如IEEE TPAMI、TVCG、TIP、SIGGRAPH,IJCV、CVPR、ICCV,相關技術用在國家重點型號工程。

目錄

第1章 緒論
1 1 大模型基本概念
1 2 大模型發展歷程
1 2 1 從技術架構看發展歷程
1 2 2 從參數規模看發展歷程
1 2 3 從模態支持看發展歷程
1 2 4 從應用領域看發展歷程
1 3 大模型關鍵技術及訓練流程
1 3 1 大模型關鍵技術
1 3 2 大模型訓練流程
1 4 本書內容安排
1 5 思考
習題1
第2章 深度學習基礎
2 1 神經網絡基礎
2 1 1 神經網絡
2 1 2 卷積神經網絡
2 2 損失函數和優化算法
2 2 1 損失函數
2 2 2 優化算法
2 3 神經網絡訓練
2 3 1 梯度和鏈式法則
2 3 2 前向傳播與反向傳播
2 3 3 訓練神經網絡示例
2 4 深度學習框架
2 4 1 主流深度學習框架
2 4 2 框架選擇和優缺點比較
2 5 思考
習題2
第3章 自然語言處理
3 1 自然語言處理概述
3 1 1 基本任務
3 1 2 發展歷程
3 1 3 應用領域
3 2 詞嵌入
3 2 1 獨熱向量
3 2 2 Word2vec
3 2 3 代碼示例
3 3 循環神經網絡
3 3 1 循環神經網絡介紹
3 3 2 循環神經網絡訓練
3 3 3 循環神經網絡梯度問題
3 3 4 雙向循環神經網絡
3 4 長短期記憶網絡
3 4 1 長短期記憶網絡介紹
3 4 2 長短期記憶網絡應用
3 5 門控循環單元
3 5 1 門控循環單元介紹
3 5 2 門控循環單元應用
3 6 思考
習題3
第4章 大模型網絡結構
4 1 Transformer
4 1 1 注意力機制
4 1 2 編碼器-解碼器結構
4 1 3 大模型中的編碼器-解碼器結構
4 2 編碼器結構—BERT家族
4 2 1 BERT結構
4 2 2 預訓練策略
4 2 3 BERT的變體
4 3 解碼器結構—GPT家族
4 3 1 GPT結構
4 3 2 自回歸預訓練
4 3 3 後續改進
4 4 思考
習題4
第5章 大模型訓練與優化
5 1 訓練數據準備
5 1 1 數據獲取
5 1 2 數據預處理
5 1 3 數據增強
5 1 4 數據配比與課程設置
5 1 5 開源數據集
5 2 并行化和分散式訓練
5 2 1 大模型訓練的挑戰
5 2 2 并行策略
5 2 3 節點間數據通信
5 2 4 分散式訓練框架
5 3 模型壓縮
5 3 1 量化
5 3 2 剪枝
5 3 3 知識蒸餾
5 4 華為晶元助力大模型訓練與部署
5 4 1 AscendAI晶元
5 4 2 Atlas系列硬體
5 4 3 異構計算架構CANN
5 4 4 深度學習框架MindSpore
5 4 5 應用使能與行業應用
5 5 思考
習題5
第6章 大模型微調
6 1 大模型微調概述
6 2 參數高效微調
6 2 1 增量式微調
6 2 2 指定式微調
6 2 3 重參數化微調
6 2 4 混合微調
6 2 5 小結
6 3 指令微調
6 3 1 指令數據集構建
6 3 2 指令微調階段
6 4 基於人類反饋的強化學習微調
6 4 1 獎勵建模
6 4 2 強化學習微調
6 4 3 案例講解
6 5 思考
習題6
第7章 大模型提示工程
7 1 提示工程簡介
7 2 零樣本提示
7 3 少樣本提示
7 4 鏈式思考提示
7 4 1 思維鏈提示工程概述
7 4 2 零樣本思維鏈
7 4 3 思維鏈拓展
7 5 思維樹提示
7 6 檢索增強生成
7 7 自動提示工程
7 8 思考
習題7
第8章 高效大模型策略
8 1 大模型效率概述
8 1 1 大模型效率面臨的問題
8 1 2 大模型效率及其評估指標
8 2 預算效率策略:縮放定律
8 3 數據效率策略
8 3 1 數據過濾
8 3 2 主動學習/重要性採樣
8 3 3 課程學習
8 4 架構效率策略
8 4 1 高效注意力
8 4 2 高效位置編碼
8 4 3 稀疏模型
8 4 4 無注意力模型
8 5 訓練效率策略
8 5 1 穩定訓練策略
8 5 2 混合精度訓練
8 5 3 并行訓練技術
8 5 4 內存優化
8 6 推理效率策略
8 6 1 剪枝
8 6 2 知識蒸餾
8 6 3 量化
8 6 4 低秩分解
8 7 微調效率策略
8 7 1 參數高效微調
8 7 2 數據高效調整
8 8 思考
習題8
第9章 單模態通用大模型
9 1 LLaMA:一種自然語言處理大模型
9 1 1 模型結構
9 1 2 預訓練
9 1 3 微調
9 1 4 使用方法
9 2 SAM:一種圖像分割大模型
9 2 1 概述
9 2 2 提示下的圖像分割任務
9 2 3 SAM模型架構
9 2 4 SA-1B:大規模掩碼數據集
9 2 5 SAM在各視覺任務中的應用
9 2 6 SAM的使用方法
9 3 AudioLM:讓AI為你譜曲寫歌
9 3 1 概述
9 3 2 AudioLM的組件構成
9 3 3 AudioLM的訓練方式
9 3 4 AudioLM的安裝與使用
9 3 5 AudioLM的推理應用
9 4 Zero-1-to-3:二生三維
9 4 1 概述
9 4 2 Zero-1
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理