《人工智能 数据标注 通用技术要求》.docxVIP

《人工智能 数据标注 通用技术要求》.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Q/LB.□XXXXX-XXXX

PAGE2

ICS

FORMTEXT35.240.01

CCS

FORMTEXTL70

FORMTEXT51

FORMTEXT四川省地方标准

DBFORMTEXT51/TFORMTEXTXXXX—FORMTEXTXXXX

FORMTEXT?????

人工智能数据标注通用技术要求

(征求意见稿)

FORMTEXT?????

FORMDROPDOWN

FORMTEXTXXXX-FORMTEXTXX-FORMTEXTXX发布

FORMTEXTXXXX-FORMTEXTXX-FORMTEXTXX实施

FORMTEXT四川省市场监督管理局??发布

STYLEREF标准文件_文件编号DB51/TXXXX—XXXX

STYLEREF标准文件_文件编号DB51/TXXXX—XXXX

PAGEII

PAGEI

目次

TOC\o1-1\h\t标准文件_一级条标题,2,标准文件_附录一级条标题,2,前言 II

1范围 3

2规范性引用文件 3

3术语和定义 3

4缩略语 3

5数据标注规则 4

5.1基本要求 4

5.2规则制定与验证 4

5.3特殊数据的规则要求 4

6数据标注工具及平台 4

6.1基本要求 4

6.2功能要求 5

7数据标注预处理技术 5

7.1清洗 5

7.2数据分类与格式化 5

7.3数据去重与异常值检测 5

7.4预标注 5

7.5预标注与辅助工具应用 6

7.6数据安全预处理 6

8数据标注工作方式 6

8.1手工标注 6

8.2半自动标注 6

8.3自动标注 6

8.4混合式标注 6

8.5适用场景 6

9数据标注过程技术 6

9.1数据标注过程 6

9.2数据标注技术要求 7

参考文献 9

STYLEREF标准文件_文件编号DB51/TXXXX—XXXX

STYLEREF标准文件_文件编号DB51/TXXXX—XXXX

PAGEII

PAGEIII

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。

本文件由四川省大数据中心提出、归口并解释。

本文件起草单位:

本文件主要起草人:

STYLEREF标准文件_文件编号DB51/TXXXX—XXXX

STYLEREF标准文件_文件编号DB51/TXXXX—XXXX

PAGE8

PAGE7

人工智能数据标注通用技术要求

范围

本文件规定了人工智能机器学习中数据标注通用技术要求的术语和定义、数据标注规则、数据标注工具及平台、数据标注预处理技术要求、数据标注工作方式、数据标注过程技术和数据标注安全与合规性。

本文件适用于指导四川省行政区域范围内,在人工智能机器学习中实施数据标注的机构、组织在各类人工智能应用中的数据标注工作,包括但不限于文本、语音、图像、视频、多模态数据等。

规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

GB/T41867信息技术人工智能术语

GB/T42755人工智能面向机器学习的数据标注规程

术语和定义

GB/T41867、GB/T42755界定的以及下列术语和定义适用于本文件。

数据标注datalabeling

给数据样本指定目标变量或类别,并对其进行分类、描述或赋值的过程,以满足机器学习和人工智能模型训练需求。

数据标注预处理技术datalabelingpreprocessingtechnology

在正式开始标注作业前,通过人工或技术的方式对待标注数据做筛选或预备标注。

手工标注manuallabeling

完全由人工执行的标注任务,适用于高精度或复杂语境下的数据处理。

半自动标注semi-automaticlabeling

由人工和机器混合完成的标注任务,机器提供初步标注,人工进行校对、补充和修正。

自动标注automaticlabeling

完全由算法或系统自动执行的数据标注任务。

标注结果需人工抽检或复核,以确保质量。

缩略语

下列缩略语适用于本

文档评论(0)

土豆马铃薯 + 关注
实名认证
文档贡献者

资料大多来源网络,仅供交流与学习参考, 如有侵犯版权,请私信删除!

1亿VIP精品文档

相关文档