*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202405*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:R數據挖掘實戰 ISBN:9787115616456 出版社:人民郵電 著編譯者:安德烈亞.奇里洛 頁數:310 所在地:中國大陸 *此為代購商品 書號:1632287 可大量預訂,請先連絡。 編輯推薦 通過實際用例和現實數據集來實施數據挖掘技術,深入數據挖掘,掌握R語言精髓,開啟數據分析新境界!內容簡介 R語言數據挖掘被廣泛應用於不同領域,包括金融、醫學、科學研究等。本書通過具體實例和真實的數據集來實現數據挖掘,首先講解了數據挖掘的基本概念和R語言的基礎知識,隨後介紹了R語言中與數據挖掘相關的各種擴展功能包的使用,並通過多個實際的例子,教會讀者整理數據、分析數據的方法。 本書適合想通過R語言快速了解數據挖掘、預測分析、商業分析等領域的數據科學家和數據分析員閱讀,也適合高等院校數據挖掘相關專業師生和對數據挖掘感興趣的技術人員參考。作者簡介 安德烈亞·奇里洛(Andrea Cirillo)目前就職于義大利聯合聖保羅銀行,擔任審計量化分析師。在此之前,他曾在德勤會計師事務所從事財務和外部審計相關工作,以及在FNM(一家義大利上市公司)從事內部審計相關工作。他目前的主要工作職責是圍繞「巴塞爾協議I」進行信用風險管理模型的評估及改進。他與Francesca結婚,並共同養育4個子女,他們的名字分別是Tommaso、Gianna、Zaccaria和Filippo。安德烈亞曾編寫並貢獻了一些有用的R語言程序包,包括updateR、ramazon和paletteR。此外,他會定期分享一些關於R語言編程的深刻見解和教程。他的研究工作主要聚焦于通過建模定製演算法以及開發互動式應用程序,實現R語言在風險管理和欺詐檢測領域的應用。目錄 第1章 為何選擇R語言1 1 什麼是R語言 1 2 R語言的發展歷史 1 3 R語言的優勢 1 3 1 開源 1 3 2 插件就緒 1 3 3 數據可視化友好 1 4 安裝R語言、編寫R語言代碼 1 4 1 下載R語言軟體包 1 4 2 應用於Windows平台和MacOS平台的R語言軟體包 1 4 3 應用於Linux平台的R語言軟體包 1 4 4 基礎版本R語言包安裝的主要組件 1 4 5 編寫R語言及運行R語言代碼的替代平台 1 5 R語言的基本概念 1 5 1 R語言初級入門 1 5 2 向量(Vector) 1 5 3 列表(Lists) 1 5 4 數據幀(Dataframes) 1 5 5 函數(Functions) 1 6 R語言的劣勢以及如何克服這些劣勢 1 6 1 高效學習R語言,最小化精力投入 1 6 2 通過R語言操作大型數據集 1 7 更多參考 1 8 小結 第2章 數據挖掘入門-讀者銀行賬戶數據分析 2 1 獲取並準備銀行數據 2 1 1 數據模型 2 2 使用數據透視表匯總數據 2 2 1 管道操作符簡介 2 2 2 dplyr程序包簡介 2 2 3 安裝必要程序包並將個人數據載入到R語言環境中 2 2 4 確定每月和每天的費用總額 2 4 使用ggplot2程序包對數據進行可視化處理 2 4 1 數據可視化基本原理 2 4 2 使用ggplot程序包來進行數據可視化 2 5 更多參考 2 6 小結 第3章 數據挖掘進階-數據挖掘標準流程(CRISP-DM)方法論 3 1 數據挖掘標準流程(CRISP-DM)方法論之數據挖掘周期 3 2 業務理解 3 3 數據理解 3 3 1 數據收集 3 3 2 數據描述 3 3 3 數據探索 3 4 數據準備 3 5 建模 3 5 1 定義數據建模策略 3 6 評估 3 6 1 聚類評估 3 6 2 分類評估 3 6 3 回歸評估 3 6 4 如何判斷模型性能的充分性 3 7 部署 3 7 1 部署計劃開發 3 7 2 維護計劃開發 3 8 小結 第4章 保持室內整潔-數據挖掘架構 4 1 概述 4 2 數據源 4 2 1 數據源類型 4 3 資料庫和數據倉庫 4 3 1 中間層-數據集市 4 3 2 單層架構的數據倉庫 4 3 3 雙層架構的數據倉庫 4 3 4 三層架構的數據倉庫 4 3 5 實際應用的技術 4 4 數據挖掘引擎 4 4 1 解釋器 4 4 2 引擎和數據倉庫之間的介面 4 4 3 數據挖掘演算法 4 5 用戶界面 4 5 1 清晰性原則 4 6 如何使用R語言來創建數據挖掘架構 4 6 1 數據源 4 6 2 數據倉庫 4 6 3 數據挖掘引擎 4 6 4 用戶界面 4 7 更多參考 4 8 小結 第5章 如何解決數據挖掘問題-數據清洗和驗證 5 1 安靜祥和的一天 5 2 數據清洗 5 2 1 Tidydata框架 5 2 2 分析數據的結構 5 2 3 數據整理 5 2 4 驗證數據 5 2 5 數據合併 5 3 更多參考 5 4 小結 第6章 觀察數據-探索性數據分析 6 1 匯總EDA介紹 6 1 1 描述總體分佈 6 1 2 測定變數之間的相關性 6 2 圖形化EDA 6 2 1 變數分佈可視化 6 2 2 變數關係可視化 6 2 3 更多參考 6 3 小結 第7章 最初的猜想-線性回歸 7 1 定義數據建模策略 7 1 1 數據建模相關概念 7 2 應用線性回歸 7 2 1 線性回歸的直觀解釋 7 2 2 線性回歸的數學原理 7 2 3 如何在R語言中使用線性回歸 7 3 更多參考 7 4 小結 第8章 淺談模型性能評估 8 1 定義模型性能 8 1 1 模型的擬合度與模型的可解釋性 8 1 2 使用模型進行預測 8 2 測量回歸模型的性能 8 2 1 均方誤差 8 2 2 R平方 8 3 衡量分類問題模型的性能 8 3 1 混淆矩陣 8 3 2 準確度 8 3 3 靈敏度 8 3 4 特異性 8 3 5 如何選擇合適的性能統計指標 8 4 區分訓練數據集與測試數據集 8 5 更多參考 8 6 小結 第9章 不要放棄-繼續學習包括多元變數的回歸 9 1 從簡單線性回歸到多元線性回歸 9 1 1 符號 9 1 2 假設 9 2 降維 9 2 1 逐步回歸 9 2 2 主成分回歸 9 3 使用R語言擬合多元線性模型 9 3 1 模型擬合 9 3 2 變數的假設驗證 9 3 3 殘差假設驗證 9 3 4 降維 9 4 更多參考 9 5 小結 第10章 關於分類模型問題的不同展望 10 1 分類模型是什麼?讀者為什麼需要分類模型 10 1 1 線性回歸應用於分類變數的局限性 10 1 2 常用的分類演算法和模型 10 2 邏輯回歸 10 2 1 邏輯回歸的原理 10 2 2 邏輯回歸的數學原理 10 2 3 如何在R中應用邏輯回歸 10 2 4 邏輯回歸結果的可視化與解釋 10 3 支持向量機(SVM) 10 3 1 支持向量機的原支理 10 3 2 在原R語言中應用支持向量機 10 3 3 理解支持向量機的結果 10 4 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |