大模型測試技術與實踐 陳磊 9787115652867 【台灣高等教育出版社】

圖書均為代購,正常情形下,訂後約兩周可抵台。
物品所在地:中國大陸
原出版社:人民郵電
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
NT$508
商品編號: 9787115652867
供貨狀況: 尚有庫存

此商品參與的優惠活動

加入最愛
商品介紹
*完成訂單後正常情形下約兩周可抵台
*本賣場提供之資訊僅供參考,以到貨標的為正確資訊。
印行年月:202502*若逾兩年請先於客服中心或Line洽詢存貨情況,謝謝。
台灣(台北市)在地出版社,每筆交易均開具統一發票,祝您中獎最高1000萬元。
書名:大模型測試技術與實踐
ISBN:9787115652867
出版社:人民郵電
著編譯者:陳磊
頁數:244
所在地:中國大陸 *此為代購商品
書號:1710920
可大量預訂,請先連絡。

內容簡介

本書共8章,第1章概述AI(Artificial Intelligence,人工智能)系統,介紹機器學習的模型和分類,以及AI系統對測試工程師「提出」的新問題等;第2章介紹數據的處理過程,以及數據的分組方法,詳細介紹依託測試數據的測試評價方法;第3章講解模型中超參數相關的概念,以及關於模型性能的評估指標,並介紹了較為主流的模型的基準測試;第4章重點介紹AI系統的測試用例設計方法,以及傳統軟體測試方法在AI系統測試中的應用,同時也介紹ChatGPT類應用中SSE(Server-Sent Events)協議的介面測試和LangSmith在測試過程中的使用方法;第5章介紹AI道德的驗證,這也是大模型湧現后絕大多數大模型專家所關注的內容,該章重點介紹大模型的「道德」內容及驗證方法;第6章介紹提示詞工程和軟體測試,我們既要能夠測試大模型的應用,也要能夠充分利用大模型完成測試工作,該章重點介紹通過提示詞工程利用大模型完成測試工作的方法;第7章介紹智能化測試,通過學習開源的智能化測試工具及實踐,讀者可親身體驗智能化測試的好處;第8章介紹了從AI算法的智能化測試到大模型的智能化測試的轉變的知識。 本書內容通俗易懂、實例豐富,適合大模型開發者、軟體測試人員,以及大模型愛好者閱讀和學習。

目錄

第1章 AI系統概述
1 1 AI簡介
1 2 AI系統的分類
1 3 機器學習的模型和分類
1 4 AIGC是新趨勢
1 5 AI系統對測試工程師提出的新問題
1 5 1 測試徹底變成黑盒測試
1 5 2 數據集劃分困難
1 5 3 測試預期變得模糊
1 5 4 偏見識別要求高
1 5 5 多種可能性導致需要重定判斷標準
1 6 小結
第2章 數據和測試評價
2 1 數據收集和清洗
2 2 數據標註
2 3 數據集劃分
2 3 1 留出法
2 3 2 自助法
2 3 3 交叉驗證法
2 4 依託測試數據的測試評價方法
2 5 小結
第3章 AI模型評估
3 1 大模型中常用參數的含義
3 2 模型的性能度量
3 3 大模型的基準測試
3 3 1 面向自然語言處理能力的基準測試:GLUE和SuperGLUE
3 3 2 模型知識獲取能力的基準測試:MMLU、C-Eval
3 3 3 多指標綜合基準測試:HELM
3 4 小結
第4章 AI系統測試的關鍵技術和實踐
4 1 功能測試和AI系統測試困局
4 2 蛻變測試
4 3 傳統軟體的測試實踐仍然有效
4 3 1 測試用例設計方法同樣有效
4 3 2 分層測試還會發揮作用
4 3 3 兼容性測試設計方法更加重要
4 3 4 性能測試仍然有效
4 4 ChatGPT類應用中SSE協議的介面測試
4 4 1 SSE協議簡介
4 4 2 SSE服務端代碼
4 4 3 SSE客戶端代碼
4 4 4 SSE介面的測試腳本
4 5 LangSmith幫助測試大模型系統的能力和效果
4 6 AI系統的測試評估方法
4 7 小結
4 7 1 代碼自動化法
4 7 2 人工法
4 7 3 模型法
第5章 AI道德的驗證和實踐方法
5 1 AI道德
5 1 1 歧視
5 1 2 偏見
5 1 3 道德判斷
5 1 4 透明度
5 1 5 可信度
5 1 6 權利謀取
5 2 AI道德的好幫手:ModelCard
5 3 AI道德的其他驗證和實踐方法
5 4 小結
第6章 提示詞工程和軟體測試
6 1 提示詞工程
6 1 1 提示詞
6 1 2 提示詞的設計方法
6 2 大模型的思維鏈提示詞系統集成
6 2 1 通過思維鏈實現測試用例設計方法中的等價類劃分法
6 2 2 通過思維鏈實現測試用例設計方法中的因果圖法
6 3 通過LangChain封裝訊飛星火大模型的調用類
6 4 利用大模型生成數據
6 5 小結
第7章 智能化測試
7 1 智能化測試是發展的必然
7 2 分層測試中的智能化測試
7 2 1 開源的智能化單元測試
7 2 2 智能化介面測試設計思路
7 2 3 開源的智能化UI測試
7 3 小結
第8章 大模型下的智能化測試
8 1 大模型和測試技術
8 2 RAG
8 3 Embedding模型
8 4 SQLAlchemy實現資料庫的交互
8 4 1 使用filter_by()方法
8 4 2 使用filter()方法
8 4 3 使用join()方法
8 4 4 使用distinct()方法
8 4 5 使用order_by()方法
8 4 6 使用group_by()方法和having子句
8 5 通過LlamaIndex實現大模型SQL語句生成的3種方法詳解
8 5 1 查詢引擎
8 5 2 查詢時表提取
8 5 3 Retriever
8 6 LlamaIndex的NodeParser
8 6 1 文檔的NodeParser
8 6 2 HTML的NodeParser
8 6 3 JSON的NodeParser
8 6 4 Markdown的NodeParser
8 6 5 文檔分割
8 7 大模型雲服務生成介面測試腳本實戰
8 7 1 大模型雲服務的調用
8 7 2 介面測試腳本生成
8 7 3 介面測試的解決方案
8 8 本地大模型生成介面測試腳本實戰
8 8 1 Ollama在本地部署大模型
8 8 2 Ollama在區域網內部署訪問
8 8 3 Ollama常用命令
8 8 4 本地大模型驅動的介面測試實踐
8 9 基於大模型的Web自動化框架LaVague
8 10 小結
附錄A
附錄B
B 1 系統層指標
B 1 1 CPU指標
B 1 2 內存指標
B 1 3 磁碟指標
B 1 4 網絡指標
B 2 中間件層指標
B 2 1 網關
B 2 2 資料庫
B 2 3 緩存
B 2 4 MQ
B 2 5 分散式存儲系統
B 3 應用層指標
B 3 1 響應時間
B 3 2 吞吐量
B 3 3 應用資源
B 3 4 線程池
B 3 5 垃圾回收
B 3 6 錯誤信息
B 4 業務層指標
B 5 壓力機指標
詳細資料或其他書籍請至台灣高等教育出版社查詢,查後請於客服中心或Line或本社留言板留言,我們即儘速上架。
規格說明
大陸簡體正版圖書,訂購後正常情形下約兩周可抵台。
運送方式
已加入購物車
已更新購物車
網路異常,請重新整理