大模型原理與技術魏明強陳松燦 9787121488931 【台灣高等教育出版社】

Name: 大模型原理與技術 魏明強 陳松燦 9787121488931 【台灣高等教育出版社】
Brand: abooksthep
SKU: 9787121488931
Price: 439.0 TWD
Availability: InStock

圖書均為代購，正常情形下，訂後約兩周可抵台。
物品所在地：中國大陸
原出版社：電子工業

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

NT$439

商品編號: 9787121488931

供貨狀況: 尚有庫存

加入最愛

商品介紹

*書籍均為代購，我們向大陸付款發訂後即無法取消，為避免造成不必要的損失，
下訂前請慎重考慮！下訂前請慎重考慮！謝謝。
*完成訂單後正常情形下約兩周可抵台。
*本賣場提供之資訊僅供參考，以到貨標的為正確資訊。
印行年月：202409*若逾兩年請先於客服中心或Line洽詢存貨情況，謝謝。
台灣(台北市)在地出版社，每筆交易均開具統一發票，祝您中獎最高1000萬元。
書名：大模型原理與技術
ISBN：9787121488931
出版社：電子工業
著編譯者：魏明強陳松燦
頁數：343
所在地：中國大陸 *此為代購商品
書號：1718945
可大量預訂，請先連絡。

內容簡介

大模型作為人工智能技術的重要發展方向，逐漸成為未來科技發展的重要方向之一。基於此，本書重點介紹與大模型相關的基礎知識、原理與技術。本書內容包括深度學習基礎、自然語言處理、大模型網絡結構、大模型訓練與優化、大模型微調及相關應用案例等。全書強調內容的科學性與系統性，從大模型歷史發展脈絡、理論基礎、構建方法到應用場景，循序漸進地全面講解大模型技術。本書聚焦于大模型在不同領域的擴展應用，提供了應用案例的全方位學習路徑，旨在培養和提升學生的實踐和創造能力。每章都提供了相應的習題，供學生練習和鞏固知識。同時，本書通過介紹開源框架「計圖」、華為晶元、航空航天裝備製造等知識，可以讓學生了解更多國產技術。本書適合作為科研院所和本科院校計算機、人工智能、機械製造與自動化等相關專業的教材，也可以作為高職高專院校的教學參考書。

作者簡介

魏明強南京航空航天大學教授、博士生導師、腦機智能技術教育部重點實驗室副主任，國家自然科學基金優秀青年基金獲得者，江蘇省計算機學會青年科技獎和航空航天學會青年科學家獎獲得者，第14屆中國計算機圖形學大會最佳論文一等獎獲得者。博士畢業於香港中文大學並獲最佳博士畢業論文獎（2014）。目前為多個期刊的編委/客座編輯，如ACM TOMM、IEEETMM、計算機輔助設計與圖形學學報。近年來，圍繞大飛機三維掃描與測量、幾何深度學習和三維視覺等研究方向，主持國家級和省部級項目數十項；在CFF A類期刊和會議上發表學術論文150餘篇，如IEEE TPAMI、TVCG、TIP、SIGGRAPH，IJCV、CVPR、ICCV，相關技術用在國家重點型號工程。

第1章緒論
1 1 大模型基本概念
1 2 大模型發展歷程
1 2 1 從技術架構看發展歷程
1 2 2 從參數規模看發展歷程
1 2 3 從模態支持看發展歷程
1 2 4 從應用領域看發展歷程
1 3 大模型關鍵技術及訓練流程
1 3 1 大模型關鍵技術
1 3 2 大模型訓練流程
1 4 本書內容安排
1 5 思考
習題1
第2章深度學習基礎
2 1 神經網絡基礎
2 1 1 神經網絡
2 1 2 卷積神經網絡
2 2 損失函數和優化算法
2 2 1 損失函數
2 2 2 優化算法
2 3 神經網絡訓練
2 3 1 梯度和鏈式法則
2 3 2 前向傳播與反向傳播
2 3 3 訓練神經網絡示例
2 4 深度學習框架
2 4 1 主流深度學習框架
2 4 2 框架選擇和優缺點比較
2 5 思考
習題2
第3章自然語言處理
3 1 自然語言處理概述
3 1 1 基本任務
3 1 2 發展歷程
3 1 3 應用領域
3 2 詞嵌入
3 2 1 獨熱向量
3 2 2 Word2vec
3 2 3 代碼示例
3 3 循環神經網絡
3 3 1 循環神經網絡介紹
3 3 2 循環神經網絡訓練
3 3 3 循環神經網絡梯度問題
3 3 4 雙向循環神經網絡
3 4 長短期記憶網絡
3 4 1 長短期記憶網絡介紹
3 4 2 長短期記憶網絡應用
3 5 門控循環單元
3 5 1 門控循環單元介紹
3 5 2 門控循環單元應用
3 6 思考
習題3
第4章大模型網絡結構
4 1 Transformer
4 1 1 注意力機制
4 1 2 編碼器-解碼器結構
4 1 3 大模型中的編碼器-解碼器結構
4 2 編碼器結構—BERT家族
4 2 1 BERT結構
4 2 2 預訓練策略
4 2 3 BERT的變體
4 3 解碼器結構—GPT家族
4 3 1 GPT結構
4 3 2 自回歸預訓練
4 3 3 後續改進
4 4 思考
習題4
第5章大模型訓練與優化
5 1 訓練數據準備
5 1 1 數據獲取
5 1 2 數據預處理
5 1 3 數據增強
5 1 4 數據配比與課程設置
5 1 5 開源數據集
5 2 并行化和分散式訓練
5 2 1 大模型訓練的挑戰
5 2 2 并行策略
5 2 3 節點間數據通信
5 2 4 分散式訓練框架
5 3 模型壓縮
5 3 1 量化
5 3 2 剪枝
5 3 3 知識蒸餾
5 4 華為晶元助力大模型訓練與部署
5 4 1 AscendAI晶元
5 4 2 Atlas系列硬體
5 4 3 異構計算架構CANN
5 4 4 深度學習框架MindSpore
5 4 5 應用使能與行業應用
5 5 思考
習題5
第6章大模型微調
6 1 大模型微調概述
6 2 參數高效微調
6 2 1 增量式微調
6 2 2 指定式微調
6 2 3 重參數化微調
6 2 4 混合微調
6 2 5 小結
6 3 指令微調
6 3 1 指令數據集構建
6 3 2 指令微調階段
6 4 基於人類反饋的強化學習微調
6 4 1 獎勵建模
6 4 2 強化學習微調
6 4 3 案例講解
6 5 思考
習題6
第7章大模型提示工程
7 1 提示工程簡介
7 2 零樣本提示
7 3 少樣本提示
7 4 鏈式思考提示
7 4 1 思維鏈提示工程概述
7 4 2 零樣本思維鏈
7 4 3 思維鏈拓展
7 5 思維樹提示
7 6 檢索增強生成
7 7 自動提示工程
7 8 思考
習題7
第8章高效大模型策略
8 1 大模型效率概述
8 1 1 大模型效率面臨的問題
8 1 2 大模型效率及其評估指標
8 2 預算效率策略：縮放定律
8 3 數據效率策略
8 3 1 數據過濾
8 3 2 主動學習/重要性採樣
8 3 3 課程學習
8 4 架構效率策略
8 4 1 高效注意力
8 4 2 高效位置編碼
8 4 3 稀疏模型
8 4 4 無注意力模型
8 5 訓練效率策略
8 5 1 穩定訓練策略
8 5 2 混合精度訓練
8 5 3 并行訓練技術
8 5 4 內存優化
8 6 推理效率策略
8 6 1 剪枝
8 6 2 知識蒸餾
8 6 3 量化
8 6 4 低秩分解
8 7 微調效率策略
8 7 1 參數高效微調
8 7 2 數據高效調整
8 8 思考
習題8
第9章單模態通用大模型
9 1 LLaMA：一種自然語言處理大模型
9 1 1 模型結構
9 1 2 預訓練
9 1 3 微調
9 1 4 使用方法
9 2 SAM：一種圖像分割大模型
9 2 1 概述
9 2 2 提示下的圖像分割任務
9 2 3 SAM模型架構
9 2 4 SA-1B：大規模掩碼數據集
9 2 5 SAM在各視覺任務中的應用
9 2 6 SAM的使用方法
9 3 AudioLM：讓AI為你譜曲寫歌
9 3 1 概述
9 3 2 AudioLM的組件構成
9 3 3 AudioLM的訓練方式
9 3 4 AudioLM的安裝與使用
9 3 5 AudioLM的推理應用
9 4 Zero-1-to-3：二生三維
9 4 1 概述
9 4 2 Zero-1
詳細資料或其他書籍請至台灣高等教育出版社查詢，查後請於客服中心或Line或本社留言板留言，我們即儘速上架。

規格說明

大陸簡體正版圖書，訂購後正常情形下約兩周可抵台。

大模型原理與技術 魏明強 陳松燦 9787121488931 【台灣高等教育出版社】

商品介紹

規格說明

運送方式

相關商品

大模型原理與技術魏明強陳松燦 9787121488931 【台灣高等教育出版社】