大语言模型通识 第4章 人工数据标注.pptVIP

  • 13
  • 0
  • 约1.18万字
  • 约 79页
  • 2024-08-22 发布于江苏
  • 举报

大语言模型通识 第4章 人工数据标注.ppt

PART05执行数据标注图像标注专家阿德拉·巴里乌索于2007年开始使用标签系统地标注SUN数据库,标注了超过25万个物体。她记录了标注过程中曾遇到的困难和采用的解决方案,以便得到一致性高的注释。巴里乌索在数据标注中的主要心得如下。(1)在标注图像时,首先对图像进行整体评估,衡量标注难度。有些乍一看标注难度较大的图像,实际上图中的元素很少,很容易标记。4.5执行数据标注(2)标注时,通常由大到小进行标注(见图4-7)。比如开放空间中先标注天空,封闭空间内先标注天花板,然后再继续添加其他东西。图4-7由大到小标注4.5执行数据标注(3)标记的顺序不重要,但标注时最好一行行地进行,将一行内所有类型相同的对象全都标注上,降低标签写错的可能。(4)一般不标注镜子里反射的物体,这很容易造成误导。4.5执行数据标注(5)在图像中有很多线条性物体时(如图4-8中的扶手和栏杆),需要特别注意,有可能标注出与所需完全相反的内容(即孔内被标记为对象),标注线在同一个位置经过两次是正常的,刻意避免可能会出现上述情况。图4-8扶手与栏杆4.5执行数据标注(6)标注图像中出现打开的门窗等情况时,不仅仅是标

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档