內容簡介
本書主要介紹數據倉庫和數據挖掘技術的基本原理和應用方法,力求使讀者知其然還要知其所以然。全書共分為8章。第1章在介紹數據倉庫及數據挖掘技術特點的基礎上,概要介紹數據倉庫與數據挖掘的典型應用,以及兩者間的區別與聯繫。第2章介紹數據倉庫結構,數據倉庫模型,數據抽取、轉換和裝載,以及元數據。第3章介紹數據對象與類別、數據特徵的統計描述以及常用的數據預處理方法。第4章介紹OLAP的含義、0LAP的多維數據分析、OLAP系統的分類,以及OLTP與OLAP融合的前沿技術。第5章介紹關聯規則挖掘原理、關聯規則挖掘的Apriori演算法、關聯規則的評價方法、分類規則挖掘及其方法。第6章介紹分類問題的基本概念、特徵,以及決策樹分類、貝葉斯分類和K-最近鄰分類等分類方法。第7章介紹聚類分析的基本原理;分析過程;常見的聚類分析演算法,包括K-means演算法、K-中心點演算法等;聚類的質量評價。第8章介紹前饋神經網絡、卷積神經網絡、循環神經網絡和注意力機制。並結合實例介紹如何使用深度學習方法完成具體數據挖掘任務。目錄
1 數據倉庫與數據挖掘的概述