《人工智能 智能体能力分级与评测方法》.pdfVIP

  • 0
  • 0
  • 约1.77万字
  • 约 13页
  • 2026-02-27 发布于河南
  • 举报

《人工智能 智能体能力分级与评测方法》.pdf

ICS35.240

CCSL70

SAIAS

上海市人工智能行业协会团体标准

T/SAIASXXX—2026

人工智能智能体能力分级与评测方法

Artificialintelligence—Agentcapabilitygradingandevaluationmethod

(征求意见稿)

XXXX-XX-XX发布XXXX-XX-XX实施

上海市人工智能行业协会发布

T/SAIASXXX—2026

目次

前言II

1范围1

2规范性引用文件1

3术语和定义1

4基本原则1

价值导向原则1

聚焦业务原则1

客观公正原则1

独立可控原则1

5智能体能力等级模型1

能力等级2

能力维度2

能力等级要求3

6评测方法6

评测流程6

评测集构建6

评测执行6

结果判定7

结果呈现8

参考文献9

I

T/SAIASXXX—2026

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。

本文件由上海市人工智能行业协会提出并归口。

本文件起草单位:

本文件主要起草人:

本标准首次制定。

首期执行单位:

本文件版权归上海市人工智能行业协会所有。未经许可,不得擅自复制、转载、抄袭、改编、汇编、

翻译或将本标准用于其他任何商业目的。

II

T/SAIASXXX—2026

人工智能智能体能力分级与评测方法

1范围

本文件给出了智能体能力评测等级模型和评测方法。

本文件适用于智能体的需求方、开发方以及第三方评测机构等相关组织开展智能体业务能力水平

测试评估。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

ISO/IEC22989:2022信息技术人工智能人工智能概念和术语(Informationtechnology—

Artificialintelligence—Artificialintelligenceconceptsandterminology)

3术语和定义

下列术语和定义适用于本文件。

智能体agent

能够感知和响应所处环境并能执行操作以完成目标的自动化实体。

注:本文件涉及的智能体仅指运行在设备上的软件实体。

[来源:IS0/IEC22989:2022,3.1.1,有修改]

4基本原则

价值导向原则

以评估智能体支撑业务的实际能力为评测核心,锚定业务价值对应的能力水平开展评测,避免陷入

组件级技术指标细节。

聚焦业务原则

文档评论(0)

1亿VIP精品文档

相关文档