*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202408*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:多模態人工智能-大模型核心原理與關鍵技術 ISBN:9787121483196 出版社:電子工業 著編譯者:王金橋 叢書名:人工智慧新質生產力理論與實踐叢書 頁數:256 所在地:中國大陸 *此為代購商品 書號:1662463 可大量預訂,請先連絡。 內容簡介 本書是一本人工智慧通識課程教材,它系統地介紹了多模態人工智慧的基礎理論、關鍵技術及應用場景,深入分析了多模態學習、多模態訓練、多模態大模型、多模態理解、多模態檢索、多模態生成、多模態推理、多模態交互、多模態模型安全與可信等核心技術,旨在為讀者提供一個清晰、全面的多模態人工智慧的知識框架,從而幫助讀者更好地理解和應用多模態人工智慧技術。本書的出版有助於培養人工智慧領域的科技人才,推動新質生產力發展,為建設科技強國提供支撐。 本書適合高等院校計算機科學與技術和人工智慧等專業的本科生、研究生閱讀,也可供對多模態人工智慧技術感興趣的工程師和研究人員參考。作者簡介 王金橋 中國科學院自動化研究所副總工程師,紫東太初大模型研究中心常務副主任,研究員,博導,武漢人工智慧研究院院長,中國科學院大學人工智慧學院崗位教授,多模態人工智慧產業聯盟秘書長,主要從事多模態大模型、視頻分析與檢索、大規模目標識別等方面的研究。 在國際權威期刊和會議發表論文300餘篇,其中國際期刊50餘篇,國際會議220餘篇。參与國家、行業、團體標準制16項,申請發明專利50餘項,獲得15項國際演算法競賽冠軍;榮獲北京市科技進步一等獎、北京市自然科學二等獎、吳文俊人工智慧科技進步獎、華為天才少年桃李獎、中國發明創新銀獎;獲得新時代中國經濟創新人物、中科院科苑名匠團隊、武漢楷模、北京市高聚領軍人才、廣州市創新團隊領軍人才、山東省泰山領軍人才和光谷3551領軍人才等榮譽稱號。目錄 第1章 緒論1 1 引言 1 2 基本術語 1 2 1 感測器 1 2 2 模態 1 2 3 多模態 1 2 4 演算法模型 1 2 5 表徵學習 1 2 6 語義理解 1 2 7 遷移學習 1 2 8 內容生成 1 2 9 模態融合 1 2 10 模態對齊 1 2 11 多模態學習 1 3 發展歷程 1 4 應用現狀 1 5 小結 第2章 基礎知識 2 1 傳統機器學習 2 1 1 模型評估與選擇 2 1 2 線性模型 2 1 3 分類 2 1 4 回歸 2 2 深度學習 2 2 1 卷積神經網路 2 2 2 循環神經網路 2 2 3 Transformer 2 3 優化演算法 2 3 1 梯度下降演算法 2 3 2 反向傳播 2 4 應用領域 2 4 1 計算機視覺 2 4 2 自然語言處理 2 4 3 語音識別 2 5 小結 第3章 多模態學習 3 1 模態表示 3 1 1 文本模態表示 3 1 2 視覺模態表示 3 1 3 聲音模態表示 3 1 4 其他模態表示 3 1 5 多模態聯合表示 3 1 6 多模態協同表示 3 2 多模態融合 3 2 1 數據級融合 3 2 2 特徵級融合 3 2 3 目標級融合 3 2 4 混合式融合 3 3 跨模態對齊 3 3 1 顯式對齊:無監督對齊和有監督對齊 3 3 2 隱式對齊:注意力對齊和語義對齊 3 4 多模態協同學習 3 4 1 基於平行數據的協同學習 3 4 2 基於非平行數據的協同學習 3 4 3 基於混合平行數據的協同學習 3 5 小結 第4章 多模態訓練 4 1 有監督訓練 4 1 1 視覺監督訓練 4 1 2 文本監督訓練 4 1 3 多模態監督訓練 4 2 自監督訓練 4 2 1 基於對比學習的自監督訓練 4 2 2 基於掩碼學習的自監督訓練 4 3 混合監督訓練 4 3 1 有監督與自監督的混合監督訓練 4 3 2 半監督混合監督訓練 4 4 小結 第5章 多模態大模型 5 1 基礎大模型 5 1 1 語言大模型 5 1 2 視覺大模型 5 1 3 語音大模型 5 1 4 多模態基礎大模型 5 2 大語言模型推理方法 5 2 1 提示學習 5 2 2 上下文學習 5 2 3 思維鏈 5 3 模型微調 5 3 1 LoRA 5 3 2 人類反饋強化學習 5 4 分散式訓練 5 4 1 DeepSpeed 5 4 2 Megatron-LM 5 5 小結 第6章 多模態理解 6 1 圖像描述 6 1 1 描述方法 6 1 2 評價指標 6 2 視頻描述 6 2 1 視頻定位 6 2 2 視頻描述 6 2 3 視頻摘要生成 6 2 4 評價指標 6 3 視覺問答 6 3 1 問題定義 6 3 2 問答方法 6 3 3 評價指標 6 4 小結 第7章 多模態檢索 7 1 數據檢索 7 1 1 單模態數據與檢索 7 1 2 多模態數據與檢索 7 2 跨模態檢索 7 2 1 檢索方法 7 2 2 評價指標 7 3 互動式檢索 7 4 小結 第8章 多模態生成 8 1 圖像生成 8 1 1 問題定義 8 1 2 生成方法 8 1 3 評價指標 8 2 視頻生成 8 2 1 問題定義 8 2 2 生成方法 8 2 3 評價指標 8 3 語音生成 8 3 1 問題定義 8 3 2 合成方法 8 3 3 前端處理 8 3 4 後端模型 8 3 5 評價標準 8 4 小結 第9章 多模態推理 9 1 知識圖譜推理 9 1 1 基於規則學習 9 1 2 基於路徑排序 9 1 3 基於表示學習 9 1 4 基於神經網路學習 9 2 多模態推理 9 2 1 視覺問答 9 2 2 視覺常識推理 9 2 3 視覺語言導航 9 3 小結 第10章 多模態交互 10 1 可穿戴交互 10 1 1 交互方式 10 1 2 相關技術 10 1 3 智能穿戴設備 10 2 人機對話交互 10 2 1 語音識別 10 2 2 情感識別 10 2 3 語音合成 10 2 4 對話系統 10 3 聲場感知交互 10 3 1 動作識別 10 3 2 聲源定位 10 3 3 副語音信息交互增強 10 3 4 音頻感知與識別 10 4 混合現實實物交互 10 4 1 靜態被動力觸覺 10 4 2 相遇型被動力觸覺 10 5 小結 第11章 多模態模型安全與可信 11 1 模型的可解釋性 11 1 1 遷移學習 11 1 2 反向傳播和顯著性圖 11 1 3 特徵反演 11 1 4 敏感性分析 11 1 5 注意力機制 11 1 6 沙普利疊加解釋 11 2 人工智慧倫理規範 11 2 1 標準認定 11 2 2 科技倫理治理 11 2 3 行業自律 11 3 小結 第12章 總結與展望 12 1 世界模型 12 2 情感計算 12 3 類腦智能 12 4 博弈智能 12 5 小結 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |