*完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202407*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:機器學習全解-R語言版 ISBN:9787115641465 出版社:人民郵電 著編譯者:黃天元 頁數:200 所在地:中國大陸 *此為代購商品 書號:1653103 可大量預訂,請先連絡。 內容簡介 機器學習是近年來非常熱門的學科,R語言經過一段時間的發展也逐漸成為主流的編程語言之一。本書結合機器學習和R語言,面向機器學習實踐,不僅介紹了機器學習和R語言的基礎知識,而且介紹了如何藉助不同的演算法來進行模型分析,以及這些演算法在R語言中的實現方式。通過閱讀本書,讀者可以快速了解機器學習和R語言的必備知識,掌握機器學習的實現流程。 本書適合程序員、數據分析人員、對演算法感興趣的讀者、機器學習領域的從業人員及科研人員閱讀。作者簡介 黃天元 復旦大學博士,中國科學院博士后,現任浙江財經大學講師。熱愛數據科學與開源工具,致力於利用數據科學迅速積累行業經驗和探索科學發現。在CRAN上維護4個R語言包(累計下載量破10萬),著有《R語言數據高效處理指南》《文本數據挖掘:基於R語言》等圖書,並開設知乎專欄《R語言數據挖掘》目錄 第1章 機器學習概論1 1 機器學習的概念 1 2 機器學習的意義 1 3 機器學習的種類 1 4 機器學習基本流程 第2章 R語言綜合基礎 2 1 簡易環境配置 2 2 編程保留符號 2 3 基本數據類型 2 3 1 數值型 2 3 2 邏輯型 2 3 3 字元型 2 3 4 因子型 2 3 5 類型判斷與轉換 2 4 常用數據結構 2 4 1 向量 2 4 2 矩陣 2 4 3 列表 2 4 4 數據框 2 5 程序流程式控制制 2 5 1 選擇結構 2 5 2 循環結構 2 6 函數使用技巧 第3章 高效數據操作 3 1 R數據操作包簡介 3 2 數據讀寫 3 3 管道操作符 3 4 基本操作 3 4 1 篩選列 3 4 2 篩選行 3 4 3 更新 3 4 4 排序 3 4 5 匯總 3 4 6 分組計算 3 4 7 列的重命名 3 5 多表連接 3 6 長寬轉換 3 7 集合運算 3 8 缺失值處理 3 9 列表列的運用 第4章 tidyverse快速入門 4 1 數據讀取(readr) 4 2 數據整理 4 2 1 批處理(purrr) 4 2 2 因子操作(forcats) 4 2 3 時間操作(lubridate) 4 2 4 字元串操作(stringr) 4 2 5 數據框清洗(tibbledplyrtidyr) 4 3 數據可視化(ggplot2) 第5章 探索性數據分析 5 1 基本概念介紹 5 1 1 平均值 5 1 2 標準差 5 1 3 極值 5 1 4 中位數 5 1 5 相關係數 5 2 探索工具實踐 5 2 1 vtree 5 2 2 skimr 5 2 3 naniar 第6章 特徵工程 6 1 特徵修飾 6 1 1 歸一化 6 1 2 數據分箱 6 1 3 缺失值填補 6 2 特徵構造 6 2 1 構造交互項 6 2 2 基於降維技術的特徵構造 6 2 3 One-Hot編碼 6 3 特徵篩選 6 3 1 過濾法 6 3 2 封裝法 6 3 3 嵌入法 第7章 重採樣方法 7 1 針對模型評估的重採樣 7 1 1 交叉驗證 7 1 2 自舉法 7 2 針對類失衡的重採樣 第8章 模型表現的衡量 8 1 回歸模型的表現衡量 8 2 分類模型的表現衡量 第9章 模型選擇 9 1 機器學習模型概覽 9 1 1 線性回歸 9 1 2 K近鄰演算法(KNN) 9 1 3 樸素貝葉斯方法 9 1 4 判別分析 9 1 5 支持向量機 9 1 6 人工神經網路 9 1 7 決策樹 9 1 8 隨機森林 9 1 9 梯度下降法 9 2 mlr3工作流簡介 9 2 1 環境配置 9 2 2 任務定義 9 2 3 學習器選擇 9 2 4 訓練與預測 9 3 基於mlr3的模型篩選 第10章 參數調節 10 1 指定終止搜索條件 10 2 設置指定參數組合 10 3 範圍內網格搜索 10 4 範圍內隨機搜索 第11章 模型分析 11 1 變數重要性評估 11 2 變數影響作用分析 11 3 基於個案的可加性歸因方法 第12章 集成學習 12 1 集成學習的三種策略 12 1 1 裝袋法簡介 12 1 2 提升法簡介 12 1 3 堆疊法簡介 12 2 基於caret與caretEnsemble框架的集成學習實現 12 2 1 環境部署 12 2 2 數據準備 12 2 3 裝袋法 12 2 4 提升法 12 2 5 堆疊 第13章 實踐案例一:基於caret包對泰坦尼克號乘客存活率進行二分類預測 13 1 工具簡介 13 2 問題背景 13 3 數據審視 13 4 特徵工程 13 5 數據劃分 13 6 模型訓練 13 7 模型的預測與評估 13 8 超參數調節 第14章 實踐案例二:基於mlr框架對波士頓房價進行回歸預測 14 1 工具簡介 14 2 問題背景 14 3 數據審視與預處理 14 4 任務定義 14 5 建模與調參 14 6 模型表現比較 14 7 進一步的參數調節 14 8 模型解釋 第15章 實踐案例三:基於mlr3框架對皮馬印第安人糖尿病數據集進行特徵篩選 15 1 工具簡介 15 2 問題背景 15 3 去除冗餘特徵 15 4 特徵重要性排序 15 5 利用封裝法對特徵進行篩選 第16章 實踐案例四:基於tidymodels框架對鳶尾花進行多分類預測 16 1 工具簡介 16 2 問題背景 16 3 數據集劃分 16 4 數據預處理 16 5 指定重採樣方法 16 6 模型定義與調參 16 7 觀察模型在測試集的表現 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |