大語言模型基礎 (微課視頻版) 周蘇 楊武劍 9787302672869 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:清華大學
NT$381
商品編號:
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202409*若逾兩年請先於私訊洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大語言模型基礎 (微課視頻版)
ISBN:9787302672869
出版社:清華大學
著編譯者:周蘇 楊武劍
叢書名:21世紀人工智慧創新與應用叢書
頁數:215
所在地:中國大陸 *此為代購商品
書號:1681035
可大量預訂,請先連絡。

內容簡介

大語言模型(簡稱大模型)是一種基於深度學習技術的先進人工智慧模型,特別適用於理解和生成自然語言文本,它具有文生文、文生圖、文生視頻甚至未來的文生X等多種多模態形式。大模型的多功能性和通用性,使其能夠在未經專門訓練的情況下處理多種類型的自然語言任務。隨著技術的發展,大模型已經成為自然語言處理領域的重要基石,並持續推動著人工智慧技術的進步和社會應用的拓展。學習大模型課程不僅有利於個人專業成長,更能對社會進步和技術創新產生積極影響。人工智慧及其大模型技術,是每個高校學生甚至社會人必須關注、學習和重視的知識與現實。 本書介紹的大模型知識主要包括大模型基礎、模型與生成式AI、大模型架構、人工數據標註、大模型預訓練數據、大模型開發組織、提示工程與微調、強化學習方法、大模型智能體、大模型應用框架、技術倫理與限制、大模型產品評估等。 本書特色鮮明,易讀易學,適合高等院校計算機、大數據、人工智慧等相關專業學生學習,也適合對人工智慧以及大模型相關領域感興趣的讀者閱讀參考。

作者簡介

周蘇,浙江大學城市學院教授,國家科學技術部認證的創新工程師,創新培訓師。高校計算機基礎教育、計算機專業教育經驗豐富,是浙江省創新方法推廣教師團隊的核心成員。目前主要從事計算機專業教育以及創新思維與創新方法教育、大數據技術與應用教育。近期在多家出版社連續出版《創新思維與創新方法》高校教材多部。正在積極探索創新思維、創新方法和計算機教育的結合。主講課程:《創新思維與創新方法》、《大數據導論》、《大數據可視化技術》以及計算機專業教育的多門課程。

目錄

第1章 大模型基礎
1 1 人工智慧基礎
1 1 1 人工智慧的實現途徑
1 1 2 機器學習和深度學習
1 1 3 監督與無監督學習
1 2 大模型定義
1 2 1 模型預訓練和微調
1 2 2 大模型的特徵
1 2 3 大模型的優勢
1 3 大模型技術的形成
1 3 1 Blockhead思維實驗
1 3 2 大模型的歷史基礎
1 3 3 基於Transformer模型
1 3 4 大模型的世界模型問題
1 3 5 文化知識傳遞和語言支持
1 4 通用人工智慧
1 4 1 什麼是通用人工智慧
1 4 2 大模型與通用人工智慧
1 4 3 人工智慧生成內容
【作業】
【實踐與思考】了解典型的開源大模型
第2章 大模型與生成式AI
2 1 什麼是語言模型
2 1 1 語言模型的定義
2 1 2 注意力機制
2 1 3 開源還是閉源
2 2 大模型發展三階段
2 2 1 基礎模型階段
2 2 2 能力探索階段
2 2 3 突破發展階段
2 3 Transformer模型
2 3 1 Transformer過程
2 3 2 Transformer結構
2 3 3 Transformer模塊
2 4 生成式人工智慧
2 4 1 生成式AI定義
2 4 2 生成式AI層次
2 4 3 生成式預訓練語言模型GPT
【作業】
【實踐與思考】基於ChatGPT的免費工具:ChatAI小組件
第3章 大模型架構
3 1 大模型生成原理
3 1 1 上下文學習
3 1 2 指令微調
3 1 3 零樣本/少樣本
3 1 4 深度學習架構
3 1 5 訓練策略及優化技術
3 1 6 所謂世界模型
3 2 多模態語言模型
3 2 1 多模態指令微調
3 2 2 多模態上下文學習
3 2 3 多模態思維鏈
3 2 4 大模型輔助視覺推理
3 3 大模型的結構
3 3 1 LLaMA的模型結構
3 3 2 LLaMA的注意力機制
3 4 應用技術架構
3 4 1 指令工程
3 4 2 函數調用
3 4 3 檢索增強生成
3 4 4 微調
3 5 OpenAI的Sora大模型
3 5 1 Sora技術報告分析
3 5 2 Sora的主要技術特點
3 5 3 Sora的模型訓練過程
【作業】
【實踐與思考】熟悉阿里雲大模型「通義千問」
第4章 人工數據標註
4 1 知識表示方法
4 1 1 知識的概念
4 1 2 知識表示的定義
4 1 3 知識表示的過程
4 2 什麼是數據標註
4 3 數據標註分類
4 3 1 圖像標註
4 3 2 語音標註
4 3 33 D點雲標註
4 3 4 文本標註
4 4 制定標註規則
4 5 執行數據標註
4 6 標註團隊管理
【作業】
【實踐與思考】熟悉百度大模型「文心一言」
第5章 大模型預訓練數據
5 1 數據來源
5 1 1 通用數據
5 1 2 專業數據
5 2 數據處理
5 2 1 質量過濾
5 2 2 冗餘去除
5 2 3 隱私消除
5 2 4 詞元切分
5 3 數據影響分析
5 3 1 數據規模
5 3 2 數據質量
5 4 典型的開源數據集
5 4 1 Pile數據集
5 4 2 ROOTS數據集
5 5 訓練集、驗證集、測試集的異同
5 5 1 訓練、驗證與測試數據集的不同之處
5 5 2 訓練、驗證與測試數據集的相似之處
5 6 數據集面臨的挑戰
5 6 1 規模和質量待提升
5 6 2 大模型與數據集相輔相成
5 6 3 標準規範需健全
5 6 4 存儲性能待提高
【作業】
【實踐與思考】熟悉Globe Explorer智能搜索引擎
第6章 大模型開發組織
6 1 大模型開發流程
6 2 大模型的數據組織
6 2 1 數據採集
6 2 2 數據清洗和預處理
6 2 3 數據標註
6 2 4 數據集劃分
6 2 5 模型設計
6 2 6 模型初始化
6 2 7 模型訓練
6 2 8 模型驗證
6 2 9 模型保存
6 2 10 模型測試
6 2 11 模型部署
6 3 分而治之的思想
6 3 1 分散式計算
6 3 2 消息傳遞介面(MPI)
6 3 3 MapReduce模型
6 3 4 批處理和流處理
6 4 分散式訓練與策略
6 4 1 什麼是分散式訓練
6 4 2 數據并行性
6 4 3 模型并行性
6 4 4 流水線并行性
6 4 5 混合併行
6 4 6 分散式訓練集群架構
【作業】
【實踐與思考】熟悉科大訊飛大模型「訊飛星火認知」
第7章 提示工程與微調
7 1 什麼是提示工程
7 1 1 提示工程的原理
7 1 2 提示工程應用技術
7 1 3 提示的通用技巧
7 2 大模型為什麼要微調
7 3 提示學習和語境學習
7 3 1 提示學習
7 3 2 語境學習
7 4 上下文窗口擴展
7 5 指令數據的構建
7 5 1 手動構建指令
7 5 2 自動構建指令
7 5 3 開源指令數據集
7 6 微調及其PEFT流行方案
7 6 1 微調技術路線
7 6 2 提示微調
7 6 3 前綴微調
7 6 4 LoRA
7 6 5 QLoRA
【作業】
【實踐與思考】文生圖:註冊使用
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。
規格說明
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理