多模態大模型-從理論到實踐 韓曉晨 9787302686927 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$630
商品編號: 9787302686927
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202504*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:多模態大模型-從理論到實踐
ISBN:9787302686927
出版社:清華大學
著編譯者:韓曉晨
頁數:324
所在地:中國大陸 *此為代購商品
書號:1721040
可大量預訂,請先連絡。

內容簡介

本書系統地介紹多模態大模型的理論基礎、關鍵技術與實際應用。全書分為兩部分12章,第1部分(第1~5章)圍繞基礎理論與技術解析展開論述,包括基本概念、Transformer架構、跨模態對齊、模態融合,以及多模態大模型的預訓練方法、模型微調與優化等,為理解多模態大模型的構建邏輯奠定基礎。第2部分(第6~12章)聚集於多模態大模型的高級應用與場景實現,包括主流視覺語言模型(如CLIP、BLIP-2等)的實現、跨模態推理與生成的技術應用、多模態大模型的推理與優化方法、模型的安全與可信性問題,並通過多模態檢索與推薦系統、多模態語義理解系統和多模態問答系統的端到端開發實踐,展示了多模態大模型的實際落地路徑。 本書兼具理論深度與實際應用價值,適合大模型和AI研發人員、人工智能領域的從業者以及高校師生閱讀使用,也可作為培訓機構和高校人工智能及相關專業的教材或參考書。

作者簡介

韓曉晨 長期從事高性能計算與大模型訓練算力優化研究。近十年來,專註于智能計算架構優化及大規模數據處理,深耕于控制算法、機器視覺等領域。近年來,重點研究大模型訓練加速、算力調度與異構計算優化,致力於提升大模型計算效率與資源利用率,推動大規模人工智能模型的部署與應用。

目錄

第1部分 基礎理論與技術解析
第1章 緒論
1 1 多模態與大模型簡介
1 1 1 多模態數據的種類與特點
1 1 2 大模型的核心能力與應用領域
1 2 表徵學習與遷移學習
1 2 1 表徵學習
1 2 2 遷移學習
1 3 內容生成與模態對齊
1 3 1 模態對齊的實現方法與技術難點
1 3 2 多模態生成任務的典型案例
1 4 多模態大模型發展歷程
1 4 1 單模態到多模態的發展路徑
1 4 2 多模態大模型的技術里程碑匯總
1 5 本章小結
1 6 思考題
第2章 基礎知識
2 1 機器學習關鍵技術詳解
2 1 1 特徵工程與模型選擇
2 1 2 集成學習在多模態中的應用
2 2 深度學習基本原理與常用技術點
2 2 1 卷積神經網絡
2 2 2 循環神經網絡
2 2 3 分類器與多層感知機
2 2 4 激活函數
2 3 梯度下降與反向傳播算法的原理與實現
2 3 1 梯度下降算法原理與實現
2 3 2 反向傳播算法原理與實現
2 4 大模型在文本與圖像處理中的應用
2 4 1 文本處理中的生成與理解任務
2 4 2 圖像處理中的分割與檢測
2 5 本章小結
2 6 思考題
第3章 多模態大模型核心架構
3 1 Transformer基本原理剖析
3 1 1 自注意力機制
3 1 2 編碼器—解碼器架構
3 2 跨模態對齊技術:注意力機制與嵌入對齊
3 2 1 嵌入空間的對齊方法與損失函數優化
3 2 2 多頭注意力機制在對齊中的應用
3 3 模態融合數據級、特徵級與目標級
3 3 1 數據級融合的實現與場景應用
3 3 2 特徵級融合的建模方法與優化
3 4 模態解耦與共享學習框架
3 4 1 模態解耦的多任務學習策略
3 4 2 參數共享框架的設計與優化
3 5 本章小結
3 6 思考題
第4章 多模態大模型的預訓練方法
4 1 文本與視覺聯合預訓練任務設計
4 1 1 文本任務的掩碼建模與生成任務
4 1 2 視覺任務的特徵提取與目標檢測
4 2 自監督學習與多模態預訓練
4 2 1 對比學習在多模態中的實現方法
4 2 2 重建任務的自監督學習實現
4 3 提示學習與指令微調
4 3 1 提示模板設計與輸入增強技術
4 3 2 指令微調的適配流程與效果分析
4 4 數據高效利用遷移學習與混合監督
4 4 1 遷移學習的小樣本適配技術
4 4 2 半監督學習的聯合訓練方法
4 5 本章小結
4 6 思考題
第5章 多模態大模型微調與優化
5 1 基於LoRA的輕量化微調
5 1 1 LoRA:參數凍結與動態注入技術
5 1 2 輕量化微調
5 2 參數高效微調
5 2 1 PEFT的技術原理與實現
5 2 2 微調效果的對比與性能評價
5 3 RLHF原理及實現
5 3 1 RLHF與獎勵建模
5 3 2 RLHF在多模態任務中的實現
5 4 多任務學習與領域適配
5 4 1 多任務共享學習
5 4 2 領域適配與標註數據增強技術
5 5 本章小結
5 6 思考題
第2部分 高級應用與實踐探索
第6章 視覺語言模型的實現
6 1 CLIP模型的原理與實現
6 1 1 文本視覺聯合嵌入的實現技術
6 1 2 CLIP模型的預訓練目標與任務遷移
6 2 BLIP-2模型在多模態生成中的應用
6 2 1 圖像到文本生成的模型設計
6 2 2 多模態生成任務的優化策略
6 3 SAM模型在視覺任務中的實現
6 3 1 SAM模型的特徵提取與訓練方法
6 3 2 分割任務中的應用與性能分析
6 4 視頻與語言多模態模型融合
6 4 1 視頻嵌入與文本生成的聯合建模
6 4 2 多模態視頻任務的優化實踐
6 5 本章小結
6 6 思考題
第7章 跨模態推理與生成
7 1 視覺問答與視覺常識推理
7 1 1 視覺問答模型的任務建模方法
7 1 2 常識推理中的視覺語義問題
7 2 跨模態文本生成:從圖像到描述
7 2 1 圖像描述生成模型訓練方法
7 2 2 跨模態文本生成的關鍵技術
7 3 複雜場景中的視頻生成與理解
7 3 1 視頻生成任務
7 3 2 複雜場景的視頻理解技術
7 4 跨模態對話與導航任務
7 4 1 對話系統中的多模態交互設計
7 4 2 導航任務的視覺與語義聯合優化
7 5 本章小結
7 6 思考題
第8章 多模態大模型的推理優化
8 1 ONNX與TensorRT在多模態推理中的應用
8 1 1 ONNX模型的優化與轉換流程
8 1 2 TensorRT的推理加速與量化技術
8 2 動態批量與自定義運算元優化
8 2 1 動態批量推理的實現與性能分析
8 2 2 自定義運算元的設計與任務適配
8 3 混合精度推理與內存優化技術
8 3 1 混合精度訓練的實現與性能提升
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理