数据标注工程——概念、方法、工具与案例-线上实验.doc

数据标注工程——概念、方法、工具与案例-线上实验.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

STYLEREF标题1STYLEREF标题1字《数据标注工程》免费线上实验V1.0

《数据标注工程》免费线上实验V1.0

数加加众包培训学院是基于“数加加众包”平台(/)的在线培训系统,可针对已经注册的新手用户开展数加加新手课堂、数据标注基础培训(含人体拉框、OCR、车道线、普通对话等);同步针对平台的公会组织(数据标注服务商)负责人员,针对实际的项目工作内容开展专项培训。

1.简介

数加加众包培训学院根据不同的任务类型上线了多种培训课程,包括新手小课堂、道路线标注、OCR标注、人体拉框、人脸关键点标注等。课程一般包含视频、课程、问答题、标注练习、标注实战等内容。

2.新手小课堂

(1)数加加众包

数加加众包平台是数据堂旗下的数据众包任务平台。数加加平台网站端主要提供任务展示、任务管理、工会管理、培训、社区、个人信息维护、结算记录与金额提现等功能,数加加APP端,主要用于用户执行数据采集、数据快判类任务,以及接收数加加众包平台推送的任务上新、任务指派、数据返修提醒等信息。数加加众包平台流程图如图-1所示。

图1数加加众包平台流程图

(2)任务及公会

数加加众包任务是由项目经理根据业务需要,在平台网站端、APP等渠道发布具体的任务,如标注类、快判类、采集类、采标类、客户端类、招募类等。用户可选择感兴趣的任务信息,评估是否领取任务,成功领取任务并执行后,系统会根据任务执行情况进行费用结算。

按照任务领取人的不同,数加加众包任务分为个人任务和公会任务。个人用户只能领取个人标注任务和个人质检任务,无法领取公会任务。公会会员可执行公会的标注、自检任务(即公会或项目组的自行质检工作)。

公会是数加加众包平台为了满足精准化数据执行,高效率任务执行,便捷化团队沟通管理等需求建立的项目团队组织。公会分为个人公会和企业公会,两种公会在创建时需要提供的认证信息不同,但均可在平台领取公会任务。

公会成员可以获得更多的任务执行机会、更丰厚的收入和有经验的导师指点。

自检任务是系统对应标注任务自动生成的任务,在公会内部由会长指派自检人,自检人按标注人分批次抽检。一个自检人会对一个标注人进行一批数据检查。

(3)标注工具

数加加众包平台支持图像、语音、文本、视频、3D点云的标注,具体的标注工具如下:

1)目标检测-拉框:拉框是图片标注的一种常见类型,是指用矩形框将图片中符合标注要求的目标框选出来。

2)目标分割-图像分割:图像分割是一种复杂的2D图形标注,需要将图片中的物体按照要求使用多边形图形绘制出来,常见的有道路、发丝、全景分割。

3)关键点标注-骨骼/手势:关键点标注是需要在物体的规定位置标注关键点,常见的有人体骨骼、手势关键点,复杂的还有人脸108点等。

4)单人语音转写:单人语音转写是将一段时长较短的音频内容转写成文字,并标记是否合格。

5)中英混合TTS校验:中英混合TTS校验是对已经转写的内容进行中文、英文、拼音、音标校验,将错误的内容改正过来。

6)多段落语音标注:多段落语音标注是将一段时长较长的音频内容转写成数段文字,并填写相应的标签和属性

7)实体关系标注:实体标注是将文本内容中的实体抽取并标记实体标签,然后对有关系的实体进行关系连接。

8)交互意图标注:交互意图标注是对一句话进行拆分理解,对文本中涉及的领域、意图、槽位、槽值标记出来。

9)阅读理解标注:阅读理解顾名思义就是对一篇文章进行理解分析,阅读文章内容并进行自问自答。

10)视频事件标注:视频事件标注是对视频进行切分打点,并将切分出来的段落标记发生的事件及属性。

11)视频追踪标注:视频追踪标注是对从视频中抽帧出来的图片进行拉框标注,并保持不同视频帧图像中的同一个物体为同一个ID。

12)3D点云标注:对雷达点云文件中的物体,如车、人绘制3D图形并标记属性标签,同时对映射的2D图片进行微调,保证框的贴合。

(4)勋章

数加加平台培训学院根据课程类型配置相应的勋章,随着课程的完善,会增加不同的勋章与之对应。用户通过课程学习可获得勋章,部分任务要求用户必须拥有勋章才能领取。

不同的课程获得勋章的方式也不一样,用户需完成课程中所有小节内容,方可获得勋章。每个小节完成的标准不一样:若当前小节有标注实战,用户需完成标注实战才算完成小节;否则,用户只需阅读培训材料即可。当所有小节课程完成后,系统会自动发放并点亮课程对应的勋章!图-2为课程勋章,其中左图彩色勋章图标表示已获得当前勋章,右图灰色勋章图标表示尚未获得当前勋章。

图-2课程勋章

3.数据标注基础培训示例

数据标注基础培训包括道路线标注、OCR标注、人体拉框、人脸关键点标注、普通话对话标注、英文朗读标注等课程,本节以道路线标注、普通话对话标注为例进行介绍。

(1)道路线标注课程

道路线标注课程包含

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档