- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ICS 33.160.40
CCS A 91
山 西 省
地
14
方 标 准
DB14/T 2465—2022
人工智能 数据标注通用工作规程
2022 - 06 - 14 发布 2022 - 09 - 15 实施
山西省市场监督管理局 发 布
I
DB14/T 2465—2022
目 次
前言 II
1 范围 1
2 规范性引用文件 1
3 术语和定义 1
4 原则 1
5 工作流程 1
6 规划要求 2
7 实施要求 3
8 监控要求 3
9 交付要求 3
10 归档 4
参考文献 5
II
DB14/T 2465—2022
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第 1 部分:标准化文件的结构和起草规则》的规 定起草。
本文件由山西省工业和信息化厅提出、组织实施和监督检查。
山西省市场监督管理局对标准的组织实施情况进行监督检查。
本文件由山西省物联网和人工智能标准化技术委员会归口。
本文件起草单位:百度云计算技术 (山西) 有限公司、山西省大众科技评估中心、山西灵波微步科 技有限公司、山西物联网行业技术中心 (有限公司) 、山西集智数据服务有限公司、山西省科技评估学 会。
本文件主要起草人:司文、施佳樑、王洋、闵楠、胡驰、尉赤、张辰妹、吴泽衔、查晓丹、郭瑞鹏、 李先军、赵波、李鹏、李鹏飞。
1
DB14/T 2465—2022
人工智能 数据标注通用工作规程
1 范围
本文件规定了人工智能机器学习中数据标注生产所需要的通用工作要求,包括原则、流程、规划、 实施、监控与交付。
本文件适用于人工智能机器学习中数据标注的企业、高校、研究机构、政府机关。其他行业和机构 可参照执行。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本 (包括所有的修改单) 适用于本 文件。
DB14/T 2463 人工智能 数据标注总体框架
3 术语和定义
DB14/T 2463界定的以及下列术语和定义适用于本文件。
3.1
数据标注合格率 qualified rate of data annotation
一个标注任务中,符合标注规则要求的已标注数据总量与已标注数据总量的比值。 3.2
数据标注质量控制员 data annotation quality controller
数据标注工作中,按照标注规则从事数据审核等质量控制工作的人员。
3.3
数据标注任务 data annotation task
数据标注机构按照需方要求或合同约定,在特定的时间、成本、质量要求下完成指定数据标注的工 作。
4 原则
4.1 数据标注机构对待标注数据应遵循数据安全、保密的原则。
4.2 制定数据标注计划制定时应遵循合理性、可量化性、及时性和可调整性的原则。
4.3 数据标注生产过程应遵循全过程质量控制原则,确保生产过程质量可控。
5 工作流程
数据标注工作流程见图 1。
2
DB14/T 2465—2022
图 1 数据标注工作流程图
6 规划要求
6.1 明确需求
数据标注生产开始前,数据标注项目负责人应及时获取数据需求方数据标注的需求说明书,并应包 括以下内容:
a) 明确数据标注需求完成的时间节点;
b) 明确数据标注的内容;
c) 明确数据标注的方法;
d) 明确数据验收规则;
e) 其他要求。
6.2 获取数据
数据标注项目负责人应及时从数据需求方处获取待标注数据,数据获取方式包括:
a) 平台接口对接的方式;
b) 存储介质复制的方式。
6.3 规则验证与细化
数据标注项目负责人应按照标注规划进行标注规则验证与细化,并完成以下内容:
a) 确定数据试标数量:应遵循数据标注内容覆盖全面性及数据标注成本最小化要求,抽取需求方 指定数量作为试标数量;
b) 进行试标:应选择中等以上技能的数据标注员,按照标注规则对抽样数据进行标注,以验证标 注规则的合理性;
c) 细化数据标注规则:应遵循易理解、易操作的原则,且与数据需求方要求一致的原则,对数据 试标中发现的不合理规则进行修改细化。
6.4 明确计划
数据标注项目负责人应根据标注需求、数据试标效率确定标注计划。计划内容包括:进度计划、人 员计划、资金计划、工具计划、质量控制计划、验收计划。
6.5 专项培训
3
DB14/T 2465—2022
数据标注培训师应按照标注计划和标注规则,在数据标注生产
您可能关注的文档
- DB14T 2460-2022梅花鹿收茸技术规程.docx
- DB14T 2461-2022药用山药产地加工技术规程.docx
- DB14T 2464—2022人工智能 数据标注一般技术要求.docx
- DB14T 2471—2022高强度螺栓使用要求.docx
- DB14T 2476—2022小麦田杂草监测调查技术规范.docx
- DB14T 2478-2022山西省标准化创新贡献奖标准项目奖评审规范.docx
- DB14T 2479-2022山西省标准化创新贡献奖个人奖评审规范.docx
- DB14T 2479-2022山西省标准化创新贡献奖个人奖评审规范.pdf
- DB14T 2482—2022车用柴油快速筛查技术规范.docx
- DB14T 2486—2022知识产权服务机构 对接评估业务服务规范.docx
文档评论(0)