- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ICS 33.160.40
CCS A 91
山 西 省
地
14
方 标 准
DB14/T 2464—2022
人工智能 数据标注一般技术要求
2022 - 06 - 14 发布 2022 - 09 - 15 实施
山西省市场监督管理局 发 布
I
DB14/T 2464—2022
目 次
前言 II
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 技术分类 1
5 技术要求 1
参考文献 3
II
DB14/T 2464—2022
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规 定起草。
本文件由山西省工业和信息化厅提出、组织实施和监督检查。
山西省市场监督管理局对标准的组织实施情况进行监督检查。
本文件由山西省物联网和人工智能标准化技术委员会归口。
本文件起草单位:百度云计算技术 (山西) 有限公司、山西省大众科技评估中心、山西集智数据服 务有限公司、山西物联网行业技术中心 (有限公司) 、山西灵波微步科技有限公司、山西省科技评估学 会。
本文件主要起草人:高海峰、李昱霖、李兴华、闵楠、胡驰、尉赤、张辰妹、吴泽衔、查晓丹、李 先军、郭瑞鹏、赵波、李鹏、李鹏飞。
1
DB14/T 2464—2022
人工智能 数据标注一般技术要求
1 范围
本文件规定了人工智能机器学习中数据标注通用技术要求的术语和定义、通用技术分类和通用技术 要求。
本文件适用于人工智能机器学习中数据标注的企业、高校、研究机构、政府机关。其他行业和机构 可参照执行。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本 (包括所有的修改单) 适用于本 文件。
DB14/T 2463 人工智能 数据标注总体框架
3 术语和定义
DB14/T 2463 界定的以及下列术语和定义适用于本文件。
3.1
数据标注预处理技术 data annotation preprocessing technology
在正式开始标注作业前,通过人工或技术的方式对待标注数据做筛选或预备标注,以实现提高后续 标注效率的技术手段。
4 技术分类
4.1 数据标注通用技术
包括数据标注预处理技术和数据标注技术。
4.2 数据标注预处理技术
包括对数据清洗、预标注。
4.3 数据标注技术
包括对数据的转写、切割、评分、提取、选择、富集标注、点标注、线标注、框标注、区域标注。
5 技术要求
5.1 预处理技术要求
5.1.1 清洗
2
DB14/T 2464—2022
清洗是对数据进行结构化标注前做的预处理技术。应通过人工判断方式剔除不符合标注标准的无效 数据,筛选出可标注数据。
5.1.2 预标注
预标注技术要求应用机器学习算法对待标注数据做识别和预先标注处理。
5.2 数据标注技术要求
5.2.1 转写
应按照标注规则要求将数据转换为相应文本。
5.2.2 切割
应按照标注规则将数据分割并标注为要求的片段。
5.2.3 评分
应按照标注规则对数据进行主观判断并打分。
5.2.4 提取
应按照标注规则将主题内容提炼,描述为相应文本。
5.2.5 选择
应按照标注规则,对数据在给定选项中选择标签及属性。
5.2.6 富集标注
应根据标注规则给定的场景、主题及描述,编写出与主题相关联文本。
5.2.7 点标注
应按照标注规则,对图像中的指定位置进行标点。
5.2.8 线标注
应按照标注规则,对图像中的指定区域用线条进行标注。
5.2.9 框标注
应按照标注规则,对图像中的指定对象,用物体的最小外接框进行框选 (框选范围允许包含指定对 象外的部分区域) 。
注:如二维框选、三维框选。
5.2.10 区域标注
应按照标注规则,对图像中的指定对象进行多边形贴合标注。
3
DB14/T 2464—2022
参 考 文 献
[1] 《项目管理知识体系指南》第 5 版
[2] 《信息技术 人工智能 面向机器学习的数据标注规范》中国电子工业标准化技术协会
您可能关注的文档
- DB14T 2460-2022梅花鹿收茸技术规程.docx
- DB14T 2461-2022药用山药产地加工技术规程.docx
- DB14T 2465—2022人工智能 数据标注通用工作规程.docx
- DB14T 2471—2022高强度螺栓使用要求.docx
- DB14T 2476—2022小麦田杂草监测调查技术规范.docx
- DB14T 2478-2022山西省标准化创新贡献奖标准项目奖评审规范.docx
- DB14T 2479-2022山西省标准化创新贡献奖个人奖评审规范.docx
- DB14T 2479-2022山西省标准化创新贡献奖个人奖评审规范.pdf
- DB14T 2482—2022车用柴油快速筛查技术规范.docx
- DB14T 2486—2022知识产权服务机构 对接评估业务服务规范.docx
- 2022-2023学年山东省临沂市蒙阴县实验中学联考数学试题试卷含解析.doc
- 2022-2023学年安徽舒城桃溪中学高考适应性测试(3月1日)数学试题含解析.doc
- 2022-2023学年安徽省青阳县第一中学高三第五次月考数学试题试卷数学试题含解析.doc
- 牛呼吸道疾病综合征病原PCR检测技术规范.pdf
- 大庆市野生鸟类疫源疫病监测技术规范.pdf
- fresh线性代数作业解决问题.pdf
- 005a1630模拟电子技术基础教学大纲.pdf
- 2022-2023学年安徽省阜阳市临泉县第一中学高三第二次高考模拟考试数学试题试卷含解析.doc
- 2022-2023学年山东省临沂市兰陵县第一中学高三5月联考数学试题含解析.doc
- samsung专有内容可能会更改electrical part list电气零件清单.pdf
文档评论(0)