*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202309*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:複雜數據質量控制技術 ISBN:9787302623342 出版社:清華大學 著編譯者:曹建軍 頁數:436 所在地:中國大陸 *此為代購商品 書號:1582815 可大量預訂,請先連絡。 內容簡介 複雜性是大數據區別於小數據的本質特性,也是當前大數據質量控制與數據治理面臨的核心挑戰。本書圍繞大數據的複雜性開展研究,旨在探索當前數據資源建設與利用過程中面臨的挑戰和技術難題,促進數據價值的充分釋放。 全書分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數據控制技術的基本概念和任務定位,以及國內外的研究進展;第2部分實體分辨技術(第3∼13章),研究了高維數據實體分辨、名稱分辨、XML數據實體分辨和跨模態數據實體分辨等;第3部分真值發現技術(第14∼18章),研究了單真值發現、多真值發現、文本數據真值發現,以及基於多蟻群優化和基於深度神經網路的真值發現等;第4部分基於數據依賴的數據質量控制技術(第19∼21章),研究了數據錄入輔助預測與推理方法、不一致數據檢測與修復方法,以及有限先驗知識下的全局數據質量評估;第5部分系統與平台(第22、23章),介紹了數據質量控制系統,以及數據治理平台的設計與實現;第6部分結束語(第24章),歸納總結了當前面臨的風險和挑戰。 本書務實求新,系統性強,易讀性和可操作性好,既可作為數據質量控制與數據治理領域的進階用書,又可作為數據資源建設與利用、信息技術等相關學科領域的教學參考或工程實踐指導用書。作者簡介 曹建軍,副研究員,碩士生導師,全國優秀博士學位論文提名獎、中國博士后科學基金特別資助獲得者,主要從事數據質量控制與數據治理等方面的研究工作。2008年組建信息質量研究組(InfomationQuality Research GrotJp,IQRG),結合國內信息環境特點系統開展相關研究與實踐。先後主持省部級重點項目7項,獲省部級獎勵4項,授權發明專利4項,註冊軟體著作權2項,出版專譯著4部,發表學術論文80餘篇。目錄 第1部分 概述第1章 緒論 1 1 研究背景及意義 1 2 基本概念和任務定位 1 2 1 實體分辨 1 2 2 高維數據實體分辨 1 2 3 名稱分辨 1 2 4 XML數據實體分辨 1 2 5 跨模態數據實體分辨 1 2 6 衝突消解與真值發現 1 2 7 不一致數據檢測與修復 1 2 8 數據錄入輔助預測與修復 1 2 9 數據質量評估 1 3 本書內容結構安排 本章參考文獻 第2章 國內外研究進展 2 1 引言 2 2 高維數據實體分辨的研究進展 2 2 1 實體分辨方法 2 2 2 多目標蟻群演算法 2 2 3 特徵選擇穩定性 2 2 4 不平衡數據分類方法 2 3 名稱分辨的研究進展 2 3 1 機構名稱分辨的研究現狀 2 3 2 姓名消歧的研究現狀 2 4 XML數據實體分辨的研究進展 2 4 1 文本比較方法 2 4 2 結構比較方法 2 5 跨模態數據實體分辨的研究進展 2 5 1 單模態表徵 2 5 2 相似性度量方法 2 5 3 相似性匹配方法 2 6 真值發現的研究進展 2 6 1 結構化數據真值發現 2 6 2 文本數據真值發現 2 6 3 特殊場景下的真值發現 2 7 不一致數據檢測與修復的研究進展 2 7 1 數據檢測 2 7 2 數據修復 2 8 數據錄入輔助預測與推理的研究進展 2 8 1 數據預測模型 2 8 2 智能人機介面 2 9 全局數據質量評估的研究進展 本章小結 本章參考文獻 第2部分 實體分辨技術 第3章 高維數據特徵選擇的多目標蟻群演算法 3 1 引言 3 2 理論方法 3 2 1 兩檔案設置 3 2 2 等效路徑信息素增強策略 3 2 3 多樣性度量指標 3 3 演算法描述 3 3 1 路徑選擇概率公式 3 3 2 變異機制 3 3 3 兩檔案更新 3 3 4 信息素更新方式 3 3 5 演算法偽代碼及時間複雜度分析 3 4 實驗與分析 本章小結 本章參考文獻 第4章 高維數據特徵選擇穩定性研究 4 1 引言 4 2 特徵選擇穩定性指標分析 4 3 特徵選擇穩定性集成方法分析 4 4 演化演算法特徵選擇穩定性提升方法 4 4 1 系統描述 第3部分 真值發現技術 第4部分 基於數據依賴的數據質量控制技術 第5部分 系統與平台 第6部分 結束語 附錄 項目資助 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |