大數據挖掘導論與案例 米紅娟 楊鵬斐 易紀海 9787111755944 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
NT$508
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202407*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大數據挖掘導論與案例
ISBN:9787111755944
出版社:機械工業
著編譯者:米紅娟 楊鵬斐 易紀海
頁數:408
所在地:中國大陸 *此為代購商品
書號:1681170
可大量預訂,請先連絡。

內容簡介

本書旨在提供一個比較全面且實用的關於大數據挖掘基本概念、方法、工具、技術及應用的指南。本書共9章,包含3部分內容。第1部分介紹大數據挖掘的基礎知識、概念和方法,包括大數據的概念、發展階段和特徵,大數據挖掘的概念、標準過程模型、主要任務等內容。第2部分重點介紹具體工具與技術,包括Python的基本語法、NumPy工具包、Pandas工具包、ScikitLearn工具包和Matplotlib繪圖,以及Hadoop中的MapReduce框架和Spark大數據處理技術,目的是幫助讀者將數據挖掘的方法和演算法落到實處,同時訓練讀者解決大數據挖掘實際問題的能力。第3部分為數據挖掘案例,包括關於分類、聚類、關聯規則挖掘等應用主題的案例,每個案例都展示了一個數據挖掘項目的具體過程和細節,個別案例還給出了Python的實現方法與代碼,目的是為讀者模仿、修改、拓展、延伸、創新以及運用所學數據挖掘技術解決實際應用問題提供原型。 本書的主要特色是在重點關注數據挖掘理論、方法與演算法的同時,也適當兼顧數據挖掘的實現工具以及應用,並將它們融合,讀者通過學習能夠具備一定解決實際應用問題的能力。 本書可作為高年級本科生的數據挖掘等課程的教材,也可作為研究生相關課程的教材,還可作為對大數據挖掘與分析感興趣的學習者和在企業從事業務數據分析的人士的參考書。為方便教師教學,本書配套了電子教學課件。

作者簡介

米紅娟,蘭州財經大學教授,管理科學與工程碩士生導師。1986年畢業於蘭州大學計算數學專業,入職西北師範大學任教,隨後在復旦大學主修統計運籌學碩士研究生課程。1996年調入蘭州財經大學任教至今,期間在蘭州大學計算機應用研究生班學習升造,在日本筑波大學訪學。 主要研究方向:數據挖掘、計算機應用。 主要講授課程:數據挖掘、決策支持系統、數值分析、MATLAB、資料庫應用基礎。 近年發表論文二十余篇。主持或參与完成科研項目13項,7項通過甘肅省科技廳鑒定。作為負責人完成項目6項,包括甘肅省自然科學基金資助項目1項;作為主要負責人之一,完成甘肅省中青年科技基金項目1項。共編著教材9部,6部擔任主編,1部擔任副主編,2部參編。 曾獲蘭州市科學技術進步二等獎;多次榮獲優秀教學獎、教學成果—等獎、優秀教學成果獎、科研成果獎及「教書育人」先進個人等榮譽稱號。

目錄

前言
第1章 緒論
1 1 數據科學和數據科學家
1 1 1 數據科學的產生和數據科學家的興起
1 1 2 從事數據科學活動的重要基礎和技能
1 2 大數據的概念、發展階段和特徵
1 2 1 大數據的概念
1 2 2 大數據的發展階段
1 2 3 大數據的「5V」特徵
1 3 大數據的主要來源
1 4 大數據挖掘的概念和流程
1 4 1 大數據挖掘的概念
1 4 2 大數據挖掘的標準過程模型
1 5 大數據挖掘的主要任務
1 5 1 分類與回歸
1 5 2 聚類分析
1 5 3 關聯分析
1 5 4 異常檢測
1 6 大數據挖掘的工具與技術
1 6 1 Python
1 6 2 Hadoop
1 6 3 Spark
1 7 大數據挖掘的應用
1 7 1 在金融行業的應用
1 7 2 在電信行業的應用
1 7 3 在醫療行業的應用
1 7 4 社會網路分析
1 7 5 推薦系統
習題
參考文獻
第2章 數據分析與可視化技術
2 1 Python簡介
2 1 1 Python環境搭建
2 1 2 Python基本語法
2 2 NumPy工具包
2 2 1 創建數組
2 2 2 數組的屬性和方法
2 2 3 數組的基本操作和運算
2 2 4 數組的常用方法
2 3 Pandas工具包
2 3 1 Series
2 3 2 DataFrame概述
2 3 3 DataFrame屬性和操作
2 4 Scikit-Learn工具包
2 4 1 數據集
2 4 2 K-最近鄰分類器
2 4 3 決策樹
2 4 4 樸素貝葉斯分類器
2 4 5 多層感知器
2 4 6 支持向量機
2 4 7 隨機森林與AdaBoost
2 4 8 K-均值聚類
2 4 9 基於密度的聚類
2 4 10 主成分分析
2 5 Matplotlib繪圖
2 5 1 Figure和Subplot
2 5 2 基本繪圖方法
2 5 3 顏色、線型和標記
2 5 4 軸標籤、刻度和網格
2 5 5 添加標題、圖例和註釋
習題
實驗
參考文獻
第3章 認識數據
3 1 數據類型
3 1 1 屬性與度量
3 1 2 數據集類型
3 2 數據質量
3 2 1 測量和數據收集
3 2 2 數據應用
3 3 探索數據
3 3 1 中心趨勢度量
3 3 2 離散趨勢度量
3 3 3 數據基本統計描述的圖形顯示
3 4 數據可視化
3 4 1 一般方法和技術
3 4 2 少量屬性的可視化
3 4 3 可視化時間空間數據
3 4 4 可視化高維數據
3 5 數據對象相似性與相異性度量
3 5 1 數據矩陣與鄰近度矩陣
3 5 2 標稱屬性的鄰近度
3 5 3 二元屬性的鄰近度
3 5 4 數值屬性的鄰近度
3 5 5 序數屬性的鄰近度
3 5 6 混合類型屬性的鄰近度
3 5 7 餘弦相似度
習題
實驗
參考文獻
第4章 數據預處理
4 1 數據預處理任務
4 2 數據清洗
4 2 1 缺失值
4 2 2 雜訊數據
4 3 數據歸約
4 3 1 聚集
4 3 2 抽樣
4 3 3 維歸約
4 3 4 特徵子集選擇
4 3 5 特徵創建
4 4 離散化與二元化
4 4 1 離散化
4 4 2 二元化
4 5 數據規範化和數據泛化
4 5 1 數據規範化
4 5 2 數據泛化
習題
實驗
參考文獻
第5章 分類概念與方法
5 1 基本概念
5 2 分類的一般方法
5 3 決策樹歸納
5 3 1 決策樹歸納的基本原理
5 3 2 屬性劃分的度量
5 3 3 樹剪枝
5 3 4 決策樹歸納演算法
5 3 5 決策樹歸納的一般特點
5 4 模型的評估與選擇
5 4 1 模型的過擬合
5 4 2 模型的性能度量
5 4 3 模型評估方法
5 4 4 模型選擇
5 5 基於規則的分類
5 5 1 使用IF-THEN規則分類
5 5 2 規則分類器的性質
5 5 3 由決策樹提取規則
5 5 4 使用順序覆蓋演算法歸納規則
5 6 最近鄰分類器
5 6 1 K-最近鄰分類
5 6 2 最近鄰分類器的特點
5 7 貝葉斯分類器
5 7 1 貝葉斯定理
5 7 2 樸素貝葉斯分類器
5 7 3 樸素貝葉斯分類器的特徵
5 8 後向傳播分類
5 8 1 多層前饋神經網路
5 8 2 誤差的後向傳播演算法
5 8 3 人工神經網路的特點
5 9 支持向量機
5 9 1 線性可分支持向量機與硬間隔最大化
5 9 2 線性支持向量機與軟間隔最大化
5 9 3 非線性可分支持向量機與核函數
5 9 4 支持向量機的優缺點
5 10 集成學習方法
5 10 1 基本原理
5 10 2 隨機森林
5 10 3 AdaBoost演算法
5 10 4 類別不平衡數據的分類
5 11 多類問題
5 11 1 多類別分類
5 11 2 多標籤分類
習題
實驗
參考文獻
第6章 關聯分析概念與方法
6 1 基本概念
6 1 1 購物籃分析
6 1 2 頻繁項集和關聯規則
6 2 關聯分析的方法
6 2 1 先驗原理
6 2 2 Apriori演算法產生頻繁項集
6 2 3 Apriori演算法生成關聯規則
6 2
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理