*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202310*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:內容理解-技術、演算法與實踐 ISBN:9787111735137 出版社:機械工業 著編譯者:孫子荀 頁數:282 所在地:中國大陸 *此為代購商品 書號:1584615 可大量預訂,請先連絡。 內容簡介 這是一本在AI大模型技術背景下深入講解內容理解的技術原理、演算法實現與業務實踐的著作,由騰訊的高級總監和資深內容專家領銜撰寫,全面融入了工業界在內容業務方面積累的先進技術和成熟經驗。全書圍繞內容理解、內容生成、內容質量3大關鍵領域展開,從內容產業的發展趨勢與挑戰到各種技術和演算法,從行業的先進的研究成果到各種典型的應用案例,應有盡有。 第一部分內容理解(第1∼7章) 首先,詳細介紹了內容理解的各個模塊,包括文本、圖像、語音等單模態內容的理解以及多場景文本、視頻等多模態內容的理解,幫助讀者全面了解內容理解的核心概念、技術細節和研究進展。接著,講解了多模態學習在內容理解中的應用、多模態內容理解的理論框架和大規模預訓練技術。最後,介紹了兩個主流的內容理解框架,並結合一個自研的多模態內容理解框架,闡述了解決內容理解問題的流程和具體方案。 第二部分內容生成(第8∼11章) 詳細講解了內容生成的技術細節,結合作者團隊在業務實踐中探索的應用案例,從圖片生成、文本生成、AI素材合成到AI創作,介紹了內容創作的全棧技術,能幫助讀者由淺入深地理解內容生成的技術原理與業務實踐。 第三部分內容質量(第12∼14章) 詳細講解了信息流產品常見的內容質量問題,比如標題黨、假新聞、低俗圖片等,介紹了如何對這些與內容質量相關的業務場景進行拆解和定義,將抽象的業務場景轉化為可以建模的問題。此外,還介紹了作者團隊採用的業務建模流程以及業界常用的解決方案和研究進展。作者簡介 孫子荀,內容理解與生成領域的資深專家,騰訊高級總監和專家研究員,負責騰訊遊戲用戶增長與內容生態技術相關的工作。2012年加入騰訊,十多年來一直從事內容理解、內容生成以及數據科學技術的研究和落地工作,帶領團隊獲得十幾項公司級業務獎和技術獎。在內容生態增長、創意營銷等領域有豐富的落地經驗。帶領團隊從0到1構建了首個內容技術中台;打造了騰訊遊戲全域營銷科學體系,幫助多個業務實現降本增效。與團隊一起在人工智慧頂級學術會議上發表了多篇論文和報告,在相關領域擁有幾十項發明專利。目錄 前言 第一分 內容理解 第1章 文本內容理解 1 1 文本表示 1 1 1 文本表示的研究背景 1 1 2 文本表示的方法 1 2 文本分類 1 2 1 文本分類的研究背景 1 2 2 文本分類的方法 1 3 本章小結 第2章 圖像理解 2 1 圖像分類 2 1 1 傳統圖像分類演算法 2 1 2 深度學圖像分類演算法 2 2 圖像檢測 2 2 1 圖像匹配演算法 2 2 2 基於OpenCV的模板匹配實現 2 2 3 目標檢測演算法 2 3 實際應用:通用元素檢測框架 2 4 本章小結 第3章 語音理解 3 1 語音表徵 3 1 1 基於傳統方法的語音表徵 3 1 2 基於深度學的語音表徵 3 2 基於深度學的音樂分類 3 2 1 基於CNN的音樂分類 3 2 2 基於RNN的音樂分類 3 2 3 基於領域知識的CNN 3 2 4 基於注意力機制的後端模塊 演算法 3 3 本章小結 第4章 場景文字檢測與識別 4 1 場景文字的研究方向 4 1 1 研究問題 4 1 2 研究難點 4 1 3 未來趨勢 4 2 場景文本演算法的現狀 4 2 1 基於傳統機器學的文本檢測 4 2 2 基於傳統機器學的文本識別 4 2 3 基於深度學的文本檢測 4 2 4 基於深度學的文本識別 4 2 5 基於深度學的端到端系統 4 3 場景文本演算法輔助技術 4 3 1 不規則文本識別問題 4 3 2 文本圖像合成技術 4 3 3 半監督技術 4 4 數據集和評估標準 4 4 1 基準數據集 4 4 2 文本檢測評估標準 4 4 3 文本識別評估標準 4 5 文本檢測和識別的應用、現狀 與未來 4 5 1 應用 4 5 2 現狀 4 5 3 挑戰與未來趨勢 4 6 本章小結 第5章 視頻理解 5 1 視頻表徵 5 1 1 研究目標與意義 5 1 2 研究進展 5 2 視頻動作識別 5 2 1 研究目標與意義 5 2 2 研究難點 5 2 3 研究進展 5 3 視頻時序動作定位 5 3 1 研究目標與意義 5 3 2 研究難點 5 3 3 研究進展 5 4 視頻結構化分析 5 4 1 研究目標與意義 5 4 2 研究難點 5 4 3 基於視頻結構化的數據集 5 4 4 視頻結構的劃分方法 5 4 5 研究進展 5 5 本章小結 第6章 多模態學與內容理解 6 1 多模態內容理解的研究方向 6 1 1 研究問題 6 1 2 研究意義與挑戰 6 1 3 研究方向與應用 6 2 多模態表徵 6 2 1 因果表徵 6 2 2 聯合表徵 6 3 多模態內容理解框架 6 3 1 模態間推理 6 3 2 模態間協同 6 3 3 模態間推理:零樣本圖像 分類 6 3 4 模態間協同:虛假新聞識別 6 4 大規模預訓練技術 6 4 1 文本預訓練 6 4 2 圖像預訓練 6 4 3 音頻預訓練 6 4 4 多模態預訓練 6 5 本章小結 第7章 內容理解框架 7 1 常見的內容理解框架 7 1 1 Tensor2Tensor 7 1 2 OmniNet 7 2 自研多模態內容理解框架 7 2 1 框架設計背景 7 2 2 contentAI框架介紹 7 2 3 高度配置化 7 2 4 高度組件化 7 2 5 模式與用戶模式 7 2 6 計算式網路搭建 7 2 7 計算圖網路搭建 7 2 8 自動化數據集構建 7 2 9 化 7 2 10 快速服務化 7 2 11 內容理解 7 2 12 代碼編寫範例 7 3 本章小結 第二分 內容生成 第8章 圖片生成 8 1 基於GAN的圖片生成 8 1 1 生成對抗網路 8 1 2 條件圖片生成 8 1 3 文本轉圖片 8 1 4 圖片遷移 8 1 5 高解析度圖片生成 8 2 基於擴散模型的圖片生成 8 2 1 擴散模型 8 2 2 擴散模型生成圖片 8 3 圖片設計 8 3 1 智能裁剪 8 3 2 智能布局 8 4 本章小結 第9章 文本生成 9 1 文本生成的背景知識 9 1 1 語言模型 9 1 2 CFG文法 9 1 3 Encoder-Decoder框架 9 1 4 文本生成質量量化 9 2 文本生成演算法 9 2 1 基於統計的文本生成模型 9 2 2 基於經網路的文本生成技術 9 3 本章小結 第10章 AI素材合成 10 1 AI人臉屬性編輯 10 1 1 研究目標與意義 10 1 2 研究難點 10 1 3 研究進展 10 2 AI語音合成 10 2 1 研究目標與意義 10 2 2 基本的語音合成系統簡介 10 2 3 端到端的語音合成系統 10 2 4 基於深度學的演算法介紹 10 3 AI虛擬人技術 10 3 1 研究目標與意義 10 3 2 二維多目標人體姿態估計 10 3 3 二維-三維人體姿態轉換 10 4 AI表情合成 10 4 1 表情性 10 4 2 表情自動合成的意義及 挑戰 10 4 3 表情合成演算法 10 4 4 表情合成應用 10 5 本章小結 第11章 視頻編輯 11 1 結構化數據視頻編輯 11 1 1 基於 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |