| *完成訂單後正常情形下約兩周可抵台。 *本賣場提供之資訊僅供參考,以到貨標的為正確資訊。 印行年月:202409*若逾兩年請先於私訊洽詢存貨情況,謝謝。 台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。 書名:大語言模型基礎 (微課視頻版) ISBN:9787302672869 出版社:清華大學 著編譯者:周蘇 楊武劍 叢書名:21世紀人工智慧創新與應用叢書 頁數:215 所在地:中國大陸 *此為代購商品 書號:1681035 可大量預訂,請先連絡。 內容簡介 大語言模型(簡稱大模型)是一種基於深度學習技術的先進人工智慧模型,特別適用於理解和生成自然語言文本,它具有文生文、文生圖、文生視頻甚至未來的文生X等多種多模態形式。大模型的多功能性和通用性,使其能夠在未經專門訓練的情況下處理多種類型的自然語言任務。隨著技術的發展,大模型已經成為自然語言處理領域的重要基石,並持續推動著人工智慧技術的進步和社會應用的拓展。學習大模型課程不僅有利於個人專業成長,更能對社會進步和技術創新產生積極影響。人工智慧及其大模型技術,是每個高校學生甚至社會人必須關注、學習和重視的知識與現實。 本書介紹的大模型知識主要包括大模型基礎、模型與生成式AI、大模型架構、人工數據標註、大模型預訓練數據、大模型開發組織、提示工程與微調、強化學習方法、大模型智能體、大模型應用框架、技術倫理與限制、大模型產品評估等。 本書特色鮮明,易讀易學,適合高等院校計算機、大數據、人工智慧等相關專業學生學習,也適合對人工智慧以及大模型相關領域感興趣的讀者閱讀參考。作者簡介 周蘇,浙江大學城市學院教授,國家科學技術部認證的創新工程師,創新培訓師。高校計算機基礎教育、計算機專業教育經驗豐富,是浙江省創新方法推廣教師團隊的核心成員。目前主要從事計算機專業教育以及創新思維與創新方法教育、大數據技術與應用教育。近期在多家出版社連續出版《創新思維與創新方法》高校教材多部。正在積極探索創新思維、創新方法和計算機教育的結合。主講課程:《創新思維與創新方法》、《大數據導論》、《大數據可視化技術》以及計算機專業教育的多門課程。目錄 第1章 大模型基礎1 1 人工智慧基礎 1 1 1 人工智慧的實現途徑 1 1 2 機器學習和深度學習 1 1 3 監督與無監督學習 1 2 大模型定義 1 2 1 模型預訓練和微調 1 2 2 大模型的特徵 1 2 3 大模型的優勢 1 3 大模型技術的形成 1 3 1 Blockhead思維實驗 1 3 2 大模型的歷史基礎 1 3 3 基於Transformer模型 1 3 4 大模型的世界模型問題 1 3 5 文化知識傳遞和語言支持 1 4 通用人工智慧 1 4 1 什麼是通用人工智慧 1 4 2 大模型與通用人工智慧 1 4 3 人工智慧生成內容 【作業】 【實踐與思考】了解典型的開源大模型 第2章 大模型與生成式AI 2 1 什麼是語言模型 2 1 1 語言模型的定義 2 1 2 注意力機制 2 1 3 開源還是閉源 2 2 大模型發展三階段 2 2 1 基礎模型階段 2 2 2 能力探索階段 2 2 3 突破發展階段 2 3 Transformer模型 2 3 1 Transformer過程 2 3 2 Transformer結構 2 3 3 Transformer模塊 2 4 生成式人工智慧 2 4 1 生成式AI定義 2 4 2 生成式AI層次 2 4 3 生成式預訓練語言模型GPT 【作業】 【實踐與思考】基於ChatGPT的免費工具:ChatAI小組件 第3章 大模型架構 3 1 大模型生成原理 3 1 1 上下文學習 3 1 2 指令微調 3 1 3 零樣本/少樣本 3 1 4 深度學習架構 3 1 5 訓練策略及優化技術 3 1 6 所謂世界模型 3 2 多模態語言模型 3 2 1 多模態指令微調 3 2 2 多模態上下文學習 3 2 3 多模態思維鏈 3 2 4 大模型輔助視覺推理 3 3 大模型的結構 3 3 1 LLaMA的模型結構 3 3 2 LLaMA的注意力機制 3 4 應用技術架構 3 4 1 指令工程 3 4 2 函數調用 3 4 3 檢索增強生成 3 4 4 微調 3 5 OpenAI的Sora大模型 3 5 1 Sora技術報告分析 3 5 2 Sora的主要技術特點 3 5 3 Sora的模型訓練過程 【作業】 【實踐與思考】熟悉阿里雲大模型「通義千問」 第4章 人工數據標註 4 1 知識表示方法 4 1 1 知識的概念 4 1 2 知識表示的定義 4 1 3 知識表示的過程 4 2 什麼是數據標註 4 3 數據標註分類 4 3 1 圖像標註 4 3 2 語音標註 4 3 33 D點雲標註 4 3 4 文本標註 4 4 制定標註規則 4 5 執行數據標註 4 6 標註團隊管理 【作業】 【實踐與思考】熟悉百度大模型「文心一言」 第5章 大模型預訓練數據 5 1 數據來源 5 1 1 通用數據 5 1 2 專業數據 5 2 數據處理 5 2 1 質量過濾 5 2 2 冗餘去除 5 2 3 隱私消除 5 2 4 詞元切分 5 3 數據影響分析 5 3 1 數據規模 5 3 2 數據質量 5 4 典型的開源數據集 5 4 1 Pile數據集 5 4 2 ROOTS數據集 5 5 訓練集、驗證集、測試集的異同 5 5 1 訓練、驗證與測試數據集的不同之處 5 5 2 訓練、驗證與測試數據集的相似之處 5 6 數據集面臨的挑戰 5 6 1 規模和質量待提升 5 6 2 大模型與數據集相輔相成 5 6 3 標準規範需健全 5 6 4 存儲性能待提高 【作業】 【實踐與思考】熟悉Globe Explorer智能搜索引擎 第6章 大模型開發組織 6 1 大模型開發流程 6 2 大模型的數據組織 6 2 1 數據採集 6 2 2 數據清洗和預處理 6 2 3 數據標註 6 2 4 數據集劃分 6 2 5 模型設計 6 2 6 模型初始化 6 2 7 模型訓練 6 2 8 模型驗證 6 2 9 模型保存 6 2 10 模型測試 6 2 11 模型部署 6 3 分而治之的思想 6 3 1 分散式計算 6 3 2 消息傳遞介面(MPI) 6 3 3 MapReduce模型 6 3 4 批處理和流處理 6 4 分散式訓練與策略 6 4 1 什麼是分散式訓練 6 4 2 數據并行性 6 4 3 模型并行性 6 4 4 流水線并行性 6 4 5 混合併行 6 4 6 分散式訓練集群架構 【作業】 【實踐與思考】熟悉科大訊飛大模型「訊飛星火認知」 第7章 提示工程與微調 7 1 什麼是提示工程 7 1 1 提示工程的原理 7 1 2 提示工程應用技術 7 1 3 提示的通用技巧 7 2 大模型為什麼要微調 7 3 提示學習和語境學習 7 3 1 提示學習 7 3 2 語境學習 7 4 上下文窗口擴展 7 5 指令數據的構建 7 5 1 手動構建指令 7 5 2 自動構建指令 7 5 3 開源指令數據集 7 6 微調及其PEFT流行方案 7 6 1 微調技術路線 7 6 2 提示微調 7 6 3 前綴微調 7 6 4 LoRA 7 6 5 QLoRA 【作業】 【實踐與思考】文生圖:註冊使用 詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於PChome商店街私訊告知ISBN或書號,我們即儘速上架。 |