- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
ICS01.140.20
CCSL70
23
黑龙江省地方标准
DB23/TXXXX—2024
人工智能数据标注总体框架规范
(征求意见稿)
起草单位:黑龙江省网络空间研究中心
联系人:白瑞
联系电话
联系邮箱:guines@126.com
2024-XX-XX发布2024-XX-XX实施
黑龙江省市场监督管理局发布
DB23/TXXXX—2024
人工智能数据标注总体框架规范
1范围
本文件规定了人工智能数据标注的要求,为人工智能数据标注的生产过程提供建议。
本文件适用于面向人工智能学习、研发或应用等需要实施数据标注的企业、高校、研究机构、政府
机关。其他行业和机构可参照执行。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T35295信息技术大数据术语
GB/T25069信息安全技术术语
3术语和定义
下列术语和定义适用于本文件。
数据标注
对准备使用人工智能研究的文本、图像、音频和视频等数据进行特征标注以满足正常可用的过程。
数据标签
用于标识出数据特征并建立标注数据与人工智能可用数据之间联系的信息。
数据标注工具
能够进行数据标注及在数据标注过程中进行管理、控制等过程中发挥作用的软件的统称。
数据标注技术
对数据进行转写、切割、提取、选择、富集标注、点标注、线标注、框标注、区域标注等操作的技
术。
数据标注合格率
某项标注任务中,符合标注规则要求的已标注数据总量与所有已标注数据总量的比值。
4基本要求
标注人员
参与数据标注的人员应具有相应的资质,对于确定符合要求的人员培训环节,应做到:
a)根据标注任务说明,对标注人员进行岗前能力培训。标注能力合格者,参与标注任务;
1
DB23/TXXXX—2024
b)建立标注人员能力档案,记录标注人员承担标注任务的相关内容,用于进行标注人员能力评估
与标注质量追踪。
明确职责
规定参与人工智能数据标注的所有角色的职能,应做到:
a)设立人工智能数据管理岗位。该岗位要求对业务、法律法规比较熟悉,应根据业务实际需要
确定承担数据管理工作的部门或人员的职责;
b)明确各环节角色的职责。应明确数据标注人员、数据标注培训人员、数据标注质量控制员以
及与人工智能数据标注相关的其他角色的职责。
合法合规
应出台规章制度保障人工智能数据标注活动的合法合规性,并做到:
a)学习并严格执行与数据保护、数据安全相关的法律法规、制度等;
b)正确的对个人隐私和敏感数据进行处理,确保标注过程合法合规;
c)建立跨部门、跨组织数据标注、传输的保护制度。
保障质量
应确保人工智能数据标注的质量,并做到:
a)确保人工智能数据标注的准确性、可用性、完整性;
b)建立质量保障制度,提高数据标注合格率;
c)
文档评论(0)