多模態人工智能-大模型核心原理與關鍵技術 王金橋 9787121483196 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:電子工業
NT$636
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202408*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:多模態人工智能-大模型核心原理與關鍵技術
ISBN:9787121483196
出版社:電子工業
著編譯者:王金橋
叢書名:人工智慧新質生產力理論與實踐叢書
頁數:256
所在地:中國大陸 *此為代購商品
書號:1662463
可大量預訂,請先連絡。

內容簡介

本書是一本人工智慧通識課程教材,它系統地介紹了多模態人工智慧的基礎理論、關鍵技術及應用場景,深入分析了多模態學習、多模態訓練、多模態大模型、多模態理解、多模態檢索、多模態生成、多模態推理、多模態交互、多模態模型安全與可信等核心技術,旨在為讀者提供一個清晰、全面的多模態人工智慧的知識框架,從而幫助讀者更好地理解和應用多模態人工智慧技術。本書的出版有助於培養人工智慧領域的科技人才,推動新質生產力發展,為建設科技強國提供支撐。 本書適合高等院校計算機科學與技術和人工智慧等專業的本科生、研究生閱讀,也可供對多模態人工智慧技術感興趣的工程師和研究人員參考。

作者簡介

王金橋 中國科學院自動化研究所副總工程師,紫東太初大模型研究中心常務副主任,研究員,博導,武漢人工智慧研究院院長,中國科學院大學人工智慧學院崗位教授,多模態人工智慧產業聯盟秘書長,主要從事多模態大模型、視頻分析與檢索、大規模目標識別等方面的研究。 在國際權威期刊和會議發表論文300餘篇,其中國際期刊50餘篇,國際會議220餘篇。參与國家、行業、團體標準制16項,申請發明專利50餘項,獲得15項國際演算法競賽冠軍;榮獲北京市科技進步一等獎、北京市自然科學二等獎、吳文俊人工智慧科技進步獎、華為天才少年桃李獎、中國發明創新銀獎;獲得新時代中國經濟創新人物、中科院科苑名匠團隊、武漢楷模、北京市高聚領軍人才、廣州市創新團隊領軍人才、山東省泰山領軍人才和光谷3551領軍人才等榮譽稱號。

目錄

第1章 緒論
1 1 引言
1 2 基本術語
1 2 1 感測器
1 2 2 模態
1 2 3 多模態
1 2 4 演算法模型
1 2 5 表徵學習
1 2 6 語義理解
1 2 7 遷移學習
1 2 8 內容生成
1 2 9 模態融合
1 2 10 模態對齊
1 2 11 多模態學習
1 3 發展歷程
1 4 應用現狀
1 5 小結
第2章 基礎知識
2 1 傳統機器學習
2 1 1 模型評估與選擇
2 1 2 線性模型
2 1 3 分類
2 1 4 回歸
2 2 深度學習
2 2 1 卷積神經網路
2 2 2 循環神經網路
2 2 3 Transformer
2 3 優化演算法
2 3 1 梯度下降演算法
2 3 2 反向傳播
2 4 應用領域
2 4 1 計算機視覺
2 4 2 自然語言處理
2 4 3 語音識別
2 5 小結
第3章 多模態學習
3 1 模態表示
3 1 1 文本模態表示
3 1 2 視覺模態表示
3 1 3 聲音模態表示
3 1 4 其他模態表示
3 1 5 多模態聯合表示
3 1 6 多模態協同表示
3 2 多模態融合
3 2 1 數據級融合
3 2 2 特徵級融合
3 2 3 目標級融合
3 2 4 混合式融合
3 3 跨模態對齊
3 3 1 顯式對齊:無監督對齊和有監督對齊
3 3 2 隱式對齊:注意力對齊和語義對齊
3 4 多模態協同學習
3 4 1 基於平行數據的協同學習
3 4 2 基於非平行數據的協同學習
3 4 3 基於混合平行數據的協同學習
3 5 小結
第4章 多模態訓練
4 1 有監督訓練
4 1 1 視覺監督訓練
4 1 2 文本監督訓練
4 1 3 多模態監督訓練
4 2 自監督訓練
4 2 1 基於對比學習的自監督訓練
4 2 2 基於掩碼學習的自監督訓練
4 3 混合監督訓練
4 3 1 有監督與自監督的混合監督訓練
4 3 2 半監督混合監督訓練
4 4 小結
第5章 多模態大模型
5 1 基礎大模型
5 1 1 語言大模型
5 1 2 視覺大模型
5 1 3 語音大模型
5 1 4 多模態基礎大模型
5 2 大語言模型推理方法
5 2 1 提示學習
5 2 2 上下文學習
5 2 3 思維鏈
5 3 模型微調
5 3 1 LoRA
5 3 2 人類反饋強化學習
5 4 分散式訓練
5 4 1 DeepSpeed
5 4 2 Megatron-LM
5 5 小結
第6章 多模態理解
6 1 圖像描述
6 1 1 描述方法
6 1 2 評價指標
6 2 視頻描述
6 2 1 視頻定位
6 2 2 視頻描述
6 2 3 視頻摘要生成
6 2 4 評價指標
6 3 視覺問答
6 3 1 問題定義
6 3 2 問答方法
6 3 3 評價指標
6 4 小結
第7章 多模態檢索
7 1 數據檢索
7 1 1 單模態數據與檢索
7 1 2 多模態數據與檢索
7 2 跨模態檢索
7 2 1 檢索方法
7 2 2 評價指標
7 3 互動式檢索
7 4 小結
第8章 多模態生成
8 1 圖像生成
8 1 1 問題定義
8 1 2 生成方法
8 1 3 評價指標
8 2 視頻生成
8 2 1 問題定義
8 2 2 生成方法
8 2 3 評價指標
8 3 語音生成
8 3 1 問題定義
8 3 2 合成方法
8 3 3 前端處理
8 3 4 後端模型
8 3 5 評價標準
8 4 小結
第9章 多模態推理
9 1 知識圖譜推理
9 1 1 基於規則學習
9 1 2 基於路徑排序
9 1 3 基於表示學習
9 1 4 基於神經網路學習
9 2 多模態推理
9 2 1 視覺問答
9 2 2 視覺常識推理
9 2 3 視覺語言導航
9 3 小結
第10章 多模態交互
10 1 可穿戴交互
10 1 1 交互方式
10 1 2 相關技術
10 1 3 智能穿戴設備
10 2 人機對話交互
10 2 1 語音識別
10 2 2 情感識別
10 2 3 語音合成
10 2 4 對話系統
10 3 聲場感知交互
10 3 1 動作識別
10 3 2 聲源定位
10 3 3 副語音信息交互增強
10 3 4 音頻感知與識別
10 4 混合現實實物交互
10 4 1 靜態被動力觸覺
10 4 2 相遇型被動力觸覺
10 5 小結
第11章 多模態模型安全與可信
11 1 模型的可解釋性
11 1 1 遷移學習
11 1 2 反向傳播和顯著性圖
11 1 3 特徵反演
11 1 4 敏感性分析
11 1 5 注意力機制
11 1 6 沙普利疊加解釋
11 2 人工智慧倫理規範
11 2 1 標準認定
11 2 2 科技倫理治理
11 2 3 行業自律
11 3 小結
第12章 總結與展望
12 1 世界模型
12 2 情感計算
12 3 類腦智能
12 4 博弈智能
12 5 小結
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理