特徵工程訓練營 希南.奧茲德米爾 9787302669098 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
NT$444
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202409*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:特徵工程訓練營
ISBN:9787302669098
出版社:清華大學
著編譯者:希南.奧茲德米爾
頁數:308
所在地:中國大陸 *此為代購商品
書號:1681185
可大量預訂,請先連絡。

內容簡介

本書列舉多個實踐項目,引導讀者利用特徵工程優化訓練數據。每章探討一個代碼驅動的新案例,涉及金融、醫療等行業。你將學會清洗和轉換數據,減輕偏見。本書呈現各種性能提升技巧,涵蓋從自然語言處理到時間序列分析等所有主要機器學習子領域。

作者簡介

希南·奧茲德米爾是Shiba公司的創始人兼首席技術官(CTO),目前負責管理支持公司社交商務平台的Web3組件和機器學習模型。Sinan曾是約翰·霍普金斯大學的數據科學講師,是多種關於數據科學和機器學習的教材的作者。此外,他是已被收購的Kylie ai公司的創始人,該公司開發了具備RPA(機器人流程自動化)功能的企業級對話式人工智慧平台。Sinan擁有約翰·霍普金斯大學純數學(pure mathematics)專業碩士學位,目前居住在加利福尼亞州的舊金山市。

目錄

第1章 特徵工程簡介
1 1 特徵工程是什麼,為什麼它如此重要
1 1 1 誰需要特徵工程
1 1 2 特徵工程的局限性
1 1 3 出色的數據,出色的模型
1 2 特徵工程流程
1 3 本書的編排方式
1 3 1 特徵工程的五種類型
1 3 2 本書案例研究的概述
1 4 本章小結
第2章 特徵工程基礎知識
2 1 數據類型
2 1 1 結構化數據
2 1 2 非結構化數據
2 2 數據的四個層次
2 2 1 定性數據與定量數據
2 2 2 名義層次
2 2 3 序數層次
2 2 4 區間層次
2 2 5 比率層次
2 3 特徵工程的類型
2 3 1 特徵改進
2 3 2 特徵構建
2 3 3 特徵選擇
2 3 4 特徵提取
2 3 5 特徵學習
2 4 如何評估特徵工程的成果
2 4 1 評估指標1:機器學習度量標準
2 4 2 評估指標2:可解釋性
2 4 3 評估指標3:公平性和偏見
2 4 4 評估指標4:機器學習複雜性和速度
2 5 本章小結
第3章 醫療服務:COVID-19的診斷
3 1 COVID流感診斷數據集
3 2 探索性數據分析
3 3 特徵改進
3 3 1 補充缺失的定量數據
3 3 2 填充缺失的定性數據
3 4 特徵構建
3 4 1 數值特徵的轉換
3 4 2 構建分類數據
3 5 構建特徵工程流程
3 6 特徵選擇
3 6 1 互信息
3 6 2 假設檢驗
3 6 3 使用機器學習
3 7 練習與答案
3 8 本章小結
第4章 偏見與公平性:再犯率建模
4 1 COMPAS數據集
4 2 探索性數據分析
4 3 測量偏見和公平性
4 3 1 不同對待與不同影響
4 3 2 公平的定義
4 4 構建基準模型
4 4 1 特徵構建
4 4 2 構建基準流程
4 4 3 測量基準模型的偏見
4 5 偏見緩解
4 5 1 模型訓練前
4 5 2 模型訓練中
4 5 3 模型訓練后
4 6 構建偏見感知模型
4 6 1 特徵構建:使用Yeo-Johnson轉換器處理不同的影響
4 6 2 特徵提取:使用aif360學習公平表示實現
4 7 練習與答案
4 8 本章小結
第5章 自然語言處理:社交媒體情感分類
5 1 推文情感數據集
5 2 文本向量化
5 2 1 特徵構建:詞袋模型
5 2 2 計數向量化
5 2 3 TF-IDF向量化
5 3 特徵改進
5 3 1 清理文本中的雜訊
5 3 2 對token進行標準化
5 4 特徵提取
5 5 特徵學習
5 5 1 自動編碼器簡介
5 5 2 訓練自動編碼器以學習特徵
5 5 3 遷移學習簡介
5 5 4 使用BERT的遷移學習
5 5 5 使用BERT的預訓練特徵
5 6 文本向量化回顧
5 7 練習與答案
5 8 本章小結
第6章 計算機視覺:對象識別
6 1 CIFAR-10數據集
6 2 特徵構建:像素作為特徵
6 3 特徵提取:梯度方向直方圖
6 4 使用VGG-11進行特徵學習
6 4 1 使用預訓練的VGG-11作為特徵提取器
6 4 2 微調VGG
6 4 3 使用經過微調的VGG-11特徵進行邏輯回歸
6 5 圖像矢量化總結
6 6 練習與答案
6 7 本章小結
第7章 時間序列分析:利用機器學習進行短線交易
7 1 TWLO數據集
7 2 特徵構建
7 2 1 日期/時間特徵
7 2 2 滯后特徵
7 2 3 滾動/擴展窗口特徵
7 2 4 領域特定特徵
7 3 特徵選擇
7 3 1 使用機器學習選擇特徵
7 3 2 遞歸特徵消除
7 4 特徵提取
7 5 結論
7 6 練習與答案
7 7 本章小結
第8章 特徵存儲
8 1 MLOps和特徵存儲
8 1 1 使用特徵存儲的收益
8 1 2 維基百科、MLOps和特徵存儲
8 2 使用Hopsworks設置特徵存儲
8 2 1 使用HSFSAPI連接到Hopsworks
8 2 2 特徵組
8 2 3 使用特徵組來選擇數據
8 3 在Hopsworks中創建訓練數據
8 3 1 訓練數據集
8 3 2 數據溯源
8 4 練習與答案
8 5 本章小結
第9章 匯總
9 1 重新審視特徵工程流程
9 2 主要收穫
9 2 1 特徵工程與機器學習模型的選擇同樣至關重要
9 2 2 特徵工程並非一勞永逸的解決方案
9 3 特徵工程回顧
9 3 1 特徵改進
9 3 2 特徵構建
9 3 3 特徵選擇
9 3 4 特徵提取
9 3 5 特徵學習
9 4 數據類型特定的特徵工程技術
9 4 1 結構化數據
9 4 2 非結構化數據
9 5 常見問題解答
9 5 1 何時應將分類變數進行虛擬化,而不是將它們保留為單獨的列
9 5 2 如何確定是否需要處理數據中的偏見
9 6 其他特徵工程技術
9 6 1 分類虛擬桶化
9 6 2 將學到的特徵與傳統特徵結合
9 6 3 其他原始數據向量化器
9 7 擴展閱讀
9 8 本章小結
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理