人工智能数据标注服务规范.pdf

T/GXDSL026—2025

人工智能数据标注服务规范

一、前言

随着人工智能技术的快速发展,数据标注作为AI模型训练的基础环节,其质量和规范性直接影响

着AI系统的性能和可靠性。为了规范人工智能数据标注服务,提升数据标注质量,促进人工智能产业

的健康发展,广西产学研科学研究院特制定本团体标准。

本标准的制定遵循国家相关法律法规和标准,结合人工智能数据标注服务的实际情况,明确了数据

标注服务的基本要求、流程规范、质量控制、安全与隐私保护、人员管理等方面的内容,为数据标注服

务提供者和使用者提供了指导和参考。

本标准适用于所有提供人工智能数据标注服务的企业、机构和个人,以及使用数据标注服务的用户。

二、范围

本标准规定了人工智能数据标注服务的基本要求、流程规范、质量控制、安全与隐私保护、人员管

理等方面的内容。

本标准适用于所有提供人工智能数据标注服务的企业、机构和个人,以及使用数据标注服务的用户。

具体包括但不限于以下领域:

-计算机视觉:图像分类、目标检测、图像分割、图像标注、视频分析等。

-自然语言处理:文本分类、情感分析、机器翻译、问答系统、文本摘要等。

-语音识别:语音转文字、语音合成、语音情感分析等。

-数据挖掘:数据清洗、数据分类、数据聚类、关联规则挖掘等。

-其他领域:医疗影像分析、自动驾驶、智能客服、金融风控等。

本标准适用于以下场景:

1

T/GXDSL026—2025

-企业内部数据标注:企业为自身业务需求进行数据标注。

-数据标注外包服务:企业将数据标注任务外包给专业的数据标注服务提供商。

-众包数据标注:通过众包平台将数据标注任务分发给大量用户完成。

-开源数据标注:开放数据标注平台,供用户免费使用和贡献数据。

本标准不适用于以下内容:

-涉及国家秘密的数据标注。

-涉及个人隐私的数据标注,除非获得相关授权。

-其他法律法规禁止的数据标注活动。

本标准旨在为人工智能数据标注服务提供者和使用者提供指导和参考,促进数据标注服务的规范

化、标准化和高质量发展,推动人工智能产业的健康发展。

三、规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的版本适用于本文

件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T35273-2020信息安全技术个人信息安全规范

GB/T22239-2019信息安全技术网络安全等级保护基本要求

GB/T25069-2010信息安全技术术语

GB/T39335-2020信息技术人工智能数据标注框架与要求

GB/T38667-2020信息技术大数据数据分类指南

GB/T37988-2019信息安全技术数据安全能力成熟度模型

GB/T36344-2018信息技术数据质量评价指标

GB/T38664-2020信息技术大数据数据管理能力成熟度模型

GB/T38673-2020信息技术人工智能机器学习模型与算法规范

GB/T38674-2020信息技术人工智能数据集质量要求

2

T/GXDSL026—2025

四、术语和定义

下列术语和定义适用于本文件。

(一)人工智能数据标注

指通过人工或半自动化的方式,对原始数据进行分类、标记、注释等操作,使其成为可供机器学习

算法使用的训练数据的过程。

(二)数据标注服务提供者

指提供人工智能数据标注服务的企业、机构或个人。

(三)数据标注服务使用者

指使用人工智能数据标注服务的企业、机构或个人。

(四)数据标注工具

指用于辅助完成数据标

文档评论(0)

1亿VIP精品文档

相关文档