內容簡介
本書提供了使用Python開發機器學習應用程序的基本原理。主要內容包括:機器學習概念及其應用;數據預處理、降維;各種線性模型、集成學習方法、隨機森林、提升方法;自然語言處理、深度學習等。本書跟進了機器學習的最新研究成果,比如近幾年提出的著名演算法XGBoost和CatBoost,以及SHAP值。這些方法是機器學習領域中新穎且先進的模型。 本書目的是向讀者介紹從業人員採用的解決機器學習問題的主要現代演算法,跟蹤機器學習領域研究前沿,併為初學者提供使用機器學習的方法。本書覆蓋面廣,對所有希望在數據科學和分析任務中使用機器學習的人來說,本書既是一本很好的學習資料,同時也是一本實戰教程,其中介紹了多種統計模型,並提供了大量的相應代碼,以將這些概念一致地應用於實際問題。作者簡介
安德烈·朱薩尼Andrea Giussani 是義大利博科尼大學計算機科學的學術研究員,擁有機器學習領域豐富的理論知識和實戰經驗,長期為博科尼大學學生講授機器學習課程。同時,他擁有統計學博士學位,並且在Journal of AppliedStatistics、Statistics and Probability Letters等同行評審期刊上發表過文章。目錄
譯者的話