內容簡介
本書全程圖解式講解,通過大量全彩插圖拆解概念,讓讀者真正告別學習大模型的枯燥和複雜。 全書分為三部分,依次介紹語言模型的原理、應用及優化。第一部分理解語言模型(第1~3章),解析語言模型的核心概念,包括詞元、嵌入向量及Transformer架構,幫助讀者建立基礎認知。第二部分使用預訓練語言模型(第4~9章),介紹如何使用大模型進行文本分類、聚類、語義搜索、文本生成及多模態擴展,提升模型的應用能力。第三部分訓練和微調語言模型(第10~12章),探討大模型的訓練與微調方法,包括嵌入模型的構建、分類任務的優化及生成式模型的微調,以適應特定需求。 本書適合對大模型感興趣的開發者、研究人員和行業從業者。讀者無須深度學習基礎,只要會用Python,就可以通過本書深入理解大模型的原理並上手大模型應用開發。書中示例還可以一鍵在線運行,讓學習過程更輕鬆。作者簡介
傑伊·阿拉馬爾 Cohere總監兼工程研究員,知名大模型技術博客博主,DeepLearning AI、Udacity熱門課程作者。目錄
對本書的讚譽