內容簡介
本書是關於如何從零開始構建大模型的指南,由暢銷書作家塞巴斯蒂安·拉施卡撰寫,通過清晰的文字、圖表和實例,逐步指導讀者創建自己的大模型。在本書中,讀者將學習如何規劃和編寫大模型的各個組成部分、為大模型訓練準備適當的數據集、進行通用語料庫的預訓練,以及定製特定任務的微調。此外,本書還將探討如何利用人工反饋確保大模型遵循指令,以及如何將預訓練權重載入到大模型中。 本書適合對機器學習和生成式AI感興趣的讀者閱讀,特別是那些希望從零開始構建自己的大模型的讀者。作者簡介
塞巴斯蒂安·拉施卡(Sebastian Raschka)從密歇根州立大學獲得博士學位,在此期間他主要關注計算生物學和機器學習交叉領域的方法研究。他在2018年夏季加入威斯康星-麥迪遜大學,擔任統計學助理教授。他的主要研究活動包括開發新的深度學習體繫結構來解決生物統計學領域的問題。 Sebastian在Python編程方面擁有多年經驗,多年來針對數據科學、機器學習和深度學習的實際應用組織過多次研討會,並在SciPy(重要的Python科學計算會議)上發布過機器學習教程。 本書是Sebastian的主要學術成就之一,也是Packt和Amazon com的暢銷書之一,曾獲《ACM計算評論》2016年度最佳獎,並被翻譯成包括德文、韓文、中文、日文、俄文、波蘭文和義大利文在內的多種語言。 在閑暇時間里,Sebastian熱衷於為開源項目做貢獻,他所實現的方法現已成功用於像Kaggle這樣的機器學習競賽。目錄
第1章 理解大語言模型