大語言模型極速入門-技術與應用 董政 9787111783541 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:機械工業
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$502
商品編號: 9787111783541
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*書籍均為代購,我們向大陸付款發訂後即無法取消,為避免造成不必要的損失,
下訂前請慎重考慮!下訂前請慎重考慮!謝謝。

*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202507*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大語言模型極速入門-技術與應用
ISBN:9787111783541
出版社:機械工業
著編譯者:董政
頁數:244
所在地:中國大陸 *此為代購商品
書號:1745054
可大量預訂,請先連絡。

內容簡介

本書將帶讀者走進大語言模型的神奇世界,即使讀者沒有深厚的技術背景,也能輕鬆理解。本書首先從基礎概念講起,詳細介紹大語言模型及其技術發展脈絡。接著探討大語言模型在日常生活中的廣泛應用,比如智能客服、文本自動生成、語言翻譯等。此外,本書還會客觀地分析大語言模型的局限性和可能面臨的挑戰,例如準確性問題、倫理考慮等,幫助讀者形成全面而理性的認識。最後,本書還會展望大語言模型的未來發展趨勢,探討它們將如何為讀者所在的行業賦能。本書適合對新技術充滿好奇的普通讀者,以及希望跟上時代步伐的知識追求者閱讀。

作者簡介

董政,計算機軟體與理論專業博士,2016年畢業於復旦大學。研究生期間,師從人工智能學者危輝教授,在上海市智能信息處理重點實驗室的認知模型與算法課題組從事研究工作,研究方向包括視覺的腦神經機制和計算機建模,以及圖像中的物體形狀識別和定位等,研究成果發表于認知計算和神經網絡等領域的期刊。 畢業后,進入微軟亞太科技有限公司雲計算與人工智能事業部,擔任雲存儲服務組軟體工程師,負責雲服務的自動化監控告警和故障診斷處理,採用專家系統、異常檢測、關聯分析等方法將人工智能引入雲服務的自動化運維。

目錄


前言
第1章 早期的神經語言模型
1 1 神經網絡模型之前的時代
1 1 1 基於規則的方法面臨的困難
1 1 2 藉助統計方法的力量
1 1 3 樸素統計模型的極限
1 2 神經網絡如何理解語言
1 2 1 化解統計方法的維度災難
1 2 2 神經網絡模型如何學習
1 2 3 困惑度——量化評估語言模型的預測能力
1 2 4 詞嵌入——從詞彙到可計算的數值向量
第2章 深度學習時代的自然語言處理
2 1 擅長處理文本序列的循環神經網絡
2 1 1 保持記憶的循環連接
2 1 2 控制記憶的門控單元
2 1 3 自然語言的編碼器和解碼器
2 2 Transformer「只需要注意力」
2 2 1 注意力機制的起源
2 2 2 「只需要注意力」
2 2 3 像檢索資料庫一樣查看記憶
2 2 4 使用Transformer對語言進行編碼和解碼
第3章 預訓練語言模型的興起
3 1 通過預訓練提升語言模型能力
3 1 1 預訓練——視覺深度學習模型的成熟經驗
3 1 2 第一代GPT模型
3 1 3 GPT和BERT——選擇不同道路
3 2 語言模型如何勝任多種任務
3 2 1 多任務模型先驅的啟示
3 2 2 GPT-2模型
3 2 3 適用於多種語言的位元組對編碼
3 2 4 高質量的WebText數據集
第4章 大語言模型能力湧現
4 1 學會如何學習——元學習和語境學習能力
4 1 1 GPT-3模型
4 1 2 稀疏注意力——大模型的高效注意力機制
4 1 3 語境學習能力顯現
4 2 模型規模和能力的縮放定律
4 2 1 龍貓法則
4 2 2 能力湧現現象
4 3 大語言模型學會寫代碼
4 3 1 Codex模型——程序員的智能助手
4 3 2 檢驗語言模型的編程能力
第5章 服從指令的大語言模型
5 1 InstructGPT——更聽話的語言模型
5 1 1 從人類反饋中學習
5 1 2 近端策略優化算法
5 2 指令微調方法
5 3 拒絕採樣——蒸餾提純符合人類偏好的模型
5 4 從AI反饋中學習
第6章 開源大語言模型
6 1 GPT-J和GPT-Neo——開源社區的率先探索
6 2 Pile開源大語言模型訓練數據集
6 3 開源「羊駝」LLaMA模型
6 3 1 SwiGLU——改進神經網絡激活函數
6 3 2 適合更長文本的RoPE
6 3 3 分組查詢注意力
6 3 4 評估數據污染問題
6 3 5 更聽話的Llama2模型
6 4 ChatGLM——國產大語言模型的開源先鋒
6 4 1 研發歷程
6 4 2 語言模型的架構選擇
6 4 3 GLM-130B模型
6 4 4 悟道語料庫
第7章 探秘大語言模型的并行訓練
7 1 并行訓練一瞥
7 2 GPipe流水線
7 3 PipeDream流水線
7 3 1 高吞吐率的PipeDream-2BW流水線
7 3 2 節省內存的PipeDream-Flush流水線
第8章 大語言模型應用
8 1 常見應用場景
8 2 利用外部知識庫打敗「幻覺」
8 2 1 檢索增強生成
8 2 2 句子編碼器模型——編碼知識庫
8 2 3 小世界模型——實現快速知識檢索
8 2 4 混合檢索——重拾傳統檢索技術
8 3 思維鏈——思維過程的草稿紙
8 4 使用工具拓展能力範圍
8 4 1 學習如何使用外部工具
8 4 2 ReAct——連續自主行動的智能體
8 5 定製專屬的智能體
第9章 大語言模型前沿展望
9 1 多模態大模型——有眼睛和耳朵的大語言模型
9 1 1 視覺語言模型——從CLIP模型到火烈鳥模型
9 1 2 Llama3模型的語音輸入輸出能力
9 2 關於安全和隱私的挑戰
9 2 1 不同類型的安全和隱私問題
9 2 2 如何應對安全和隱私風險
9 3 大語言模型距離強人工智能還有多遠
9 3 1 世界模擬器——Sora視頻生成模型
9 3 2 JEPA——世界模型
9 3 3 草莓模型o1——學會「深思熟慮」
中英文對照表
參考文獻

詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理