- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Q/LB.□XXXXX-XXXX
PAGE2
ICS
FORMTEXT35.240.01
CCS
FORMTEXTL70
FORMTEXT51
FORMTEXT四川省地方标准
DBFORMTEXT51/TFORMTEXTXXXX—FORMTEXTXXXX
FORMTEXT?????
人工智能数据标注通用技术要求
(征求意见稿)
FORMTEXT?????
FORMDROPDOWN
FORMTEXTXXXX-FORMTEXTXX-FORMTEXTXX发布
FORMTEXTXXXX-FORMTEXTXX-FORMTEXTXX实施
FORMTEXT四川省市场监督管理局??发布
STYLEREF标准文件_文件编号DB51/TXXXX—XXXX
STYLEREF标准文件_文件编号DB51/TXXXX—XXXX
PAGEII
PAGEI
目次
TOC\o1-1\h\t标准文件_一级条标题,2,标准文件_附录一级条标题,2,前言 II
1范围 3
2规范性引用文件 3
3术语和定义 3
4缩略语 3
5数据标注规则 4
5.1基本要求 4
5.2规则制定与验证 4
5.3特殊数据的规则要求 4
6数据标注工具及平台 4
6.1基本要求 4
6.2功能要求 5
7数据标注预处理技术 5
7.1清洗 5
7.2数据分类与格式化 5
7.3数据去重与异常值检测 5
7.4预标注 5
7.5预标注与辅助工具应用 6
7.6数据安全预处理 6
8数据标注工作方式 6
8.1手工标注 6
8.2半自动标注 6
8.3自动标注 6
8.4混合式标注 6
8.5适用场景 6
9数据标注过程技术 6
9.1数据标注过程 6
9.2数据标注技术要求 7
参考文献 9
STYLEREF标准文件_文件编号DB51/TXXXX—XXXX
STYLEREF标准文件_文件编号DB51/TXXXX—XXXX
PAGEII
PAGEIII
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
本文件由四川省大数据中心提出、归口并解释。
本文件起草单位:
本文件主要起草人:
STYLEREF标准文件_文件编号DB51/TXXXX—XXXX
STYLEREF标准文件_文件编号DB51/TXXXX—XXXX
PAGE8
PAGE7
人工智能数据标注通用技术要求
范围
本文件规定了人工智能机器学习中数据标注通用技术要求的术语和定义、数据标注规则、数据标注工具及平台、数据标注预处理技术要求、数据标注工作方式、数据标注过程技术和数据标注安全与合规性。
本文件适用于指导四川省行政区域范围内,在人工智能机器学习中实施数据标注的机构、组织在各类人工智能应用中的数据标注工作,包括但不限于文本、语音、图像、视频、多模态数据等。
规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T41867信息技术人工智能术语
GB/T42755人工智能面向机器学习的数据标注规程
术语和定义
GB/T41867、GB/T42755界定的以及下列术语和定义适用于本文件。
数据标注datalabeling
给数据样本指定目标变量或类别,并对其进行分类、描述或赋值的过程,以满足机器学习和人工智能模型训练需求。
数据标注预处理技术datalabelingpreprocessingtechnology
在正式开始标注作业前,通过人工或技术的方式对待标注数据做筛选或预备标注。
手工标注manuallabeling
完全由人工执行的标注任务,适用于高精度或复杂语境下的数据处理。
半自动标注semi-automaticlabeling
由人工和机器混合完成的标注任务,机器提供初步标注,人工进行校对、补充和修正。
自动标注automaticlabeling
完全由算法或系统自动执行的数据标注任务。
标注结果需人工抽检或复核,以确保质量。
缩略语
下列缩略语适用于本
最近下载
- (高清版)DGJ 08-98-2014 机动车停车场(库)环境保护设计规程.docx VIP
- 《南京夫子庙秦淮河市集调研》课件.ppt VIP
- 司法协理员面试问题及答案.docx VIP
- 养殖污水处理课件.pptx
- 井巷冒顶片帮(必)讲稿.ppt VIP
- 第8课《在实践中提高认识能力》第1框《透过现象认识本质》同步课堂精品课件-【中职专用】《哲学与人生》.pptx VIP
- 聚焦户外混龄游戏,助推幼儿社会性发展.docx VIP
- 医务人员职业防护ppt课件.pptx VIP
- 广东省广州市2025-2026学年九年级上学期开学摸底考语文试卷(含答案).pdf VIP
- 2025年芜湖市12345政务服务便民热线招聘笔试参考题库附答案解析.docx VIP
文档评论(0)