視覺問答-理論與實踐 吳琦 9787121475313 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:電子工業
NT$750
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202407*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:視覺問答-理論與實踐
ISBN:9787121475313
出版社:電子工業
著編譯者:吳琦
頁數:223
所在地:中國大陸 *此為代購商品
書號:1671986
可大量預訂,請先連絡。

內容簡介

視覺問答任務要求機器根據指定的視覺圖像內容,對單輪或多輪的自然語言問題進行作答。其本質上是一個多學科的研究問題,涉及計算機視覺、自然語言處理、知識表示與推理等。 本書共5部分,第1部分介紹在計算機視覺和自然語言處理領域廣泛使用的基本方法和技術,包括卷積神經網路、序列建模和注意力機制等。本書將視覺問答分為圖像和視頻方法。第2部分將圖像視覺問答進一步分為五類,即聯合嵌入、注意力機制、記憶網路、組合推理和圖神經網路。此外,概述基於圖像的其他視覺問答任務,例如基於知識的視覺問答、視覺問答的視覺和語言預訓練。第3部分討論基於視頻的視覺問答及其相關模型。第4部分討論與視覺問答相關的高級任務,包括具身視覺問答、醫學視覺問答、基於文本的視覺問答、視覺問題生成、視覺對話和指代表達理解,它們是視覺問答任務的擴展。第5部分對該領域進行總結和展望,討論視覺問答領域的未來研究方向。 本書既可以作為視覺問答領域關鍵模型的綜述,也可作為計算機視覺和自然語言處理領域的研究人員、尤其是專註于視覺問答的研究人員和學生的教材。

作者簡介

朱文武 清華大學計算機科學與技術系教授,清華大學人工智慧研究院大數據智能中心主任,信息科學與技術國家研究中心副主任,國家973項目首席科學家。歐洲科學院院士、ACMFellow、IEEE Fellow、 AAAS Fellow、 SPIE Fellow。曾任微軟亞洲研究院主任研究員、英特爾中國研究院首席科學家與總監及美國貝爾實驗室研究員等職。主要從事多媒體智能計算、大數據分析等研究工作。曾擔任/EEE Transactions on Multimedia主編、指導委員會主席。10次獲國際最佳論文獎。獲2018年度國家自然科學二等獎(排名第1)和2012年度國家自然科學二等獎(排名第2)。

目錄

第1章 簡介
1 1 視覺問答的動機
1 2 人工智慧任務中的視覺問答
1 3 視覺問答類別
1 3 1 數據分類驅動
1 3 2 任務分類驅動
1 3 3 其他
參考文獻
第1部分 基礎理論
第2章 深度學習基礎
2 1 神經網路
2 2 卷積神經網路
2 3 循環神經網路及變體
2 4 編碼器-解碼器結構
2 5 注意力機制
2 6 記憶網路
2 7 Transformer網路和BERT
2 8 圖神經網路
參考文獻
第3章 問答基礎知識
3 1 基於規則的方法
3 2 基於信息檢索的方法
3 3 問答的神經語義解析
3 4 問答知識庫
參考文獻
第2部分 圖像視覺問答
第4章 經典視覺問答
4 1 簡介
4 2 數據集
4 3 生成與分類:兩種回答策略聯合嵌入
4 4 1 序列到序列編碼器解碼器模型
4 4 2 雙線性編碼模型
4 5 注意力機制
4 5 1 堆疊注意力網路
4 5 2 分層問題-圖像協同注意力
4 5 3 自底向上和自頂向下的注意力
4 6 記憶網路
4 6 1 改進的動態記憶網路
4 6 2 記憶增強網路
4 7 組合推理
4 7 1 神經模塊網路
4 7 2 動態神經模塊網路
4 8 圖神經網路
4 8 1 圖卷積網路
4 8 2 圖注意力網路
4 8 3 視覺問答圖卷積網路

第3部分 視頻視覺問答
第4部分 視覺問答高級任務
第5部分 總結與展望
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理