一种可解决标签偏差问题的开放世界目标检测方法.pdfVIP

一种可解决标签偏差问题的开放世界目标检测方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

华南理工大学学报(自然科学版)

第53卷第3期JournalofSouthChinaUniversityofTechnologyVol.53No.3

2025年3月(NaturalScienceEdition)March2025

doi:10.12141/j.issn.1000-565X.240109

一种可解决标签偏差问题的开放世界目标检测方法

黄阳阳许勇席星罗荣华†

(华南理工大学计算机科学与工程学院,广东广州510006)

摘要:开放世界目标检测(OWOD)将目标检测问题推广到更为复杂的现实动态场景,

要求系统能够识别图像中所有已知和未知目标的类别,并且具有根据新引入知识进行

增量学习的能力。然而,当前的开放世界目标检测方法通常将高对象分数的区域标记

为未知对象,且在很大程度上依赖于已知对象的监督。尽管这些方法能够检测出与已

知对象相似的未知对象,但存在严重的标签偏差问题,即倾向于将与已知对象不相似

的所有区域都视为背景的一部分。为解决此问题,该文首先提出了一种基于视觉大模

型的无监督区域提议生成方法,以提高模型检测未知对象的能力;然后,针对模型训

练过程中,感兴趣区域(ROI)分类阶段对新类别的敏感性会影响区域提议网络(RPN)在

提议生成阶段的泛化性能,提出了解耦RPN区域提议生成和ROI分类的联合训练方法,

以提高模型解决标签偏差问题的能力。实验结果表明:所提方法在MS-COCO数据集上

检测未知对象的性能取得了巨大的提升,未知类别的召回率是SOTA方法的2倍以上,

达到了52.1%,同时在检测已知对象类别方面也保持了竞争性;在推理速度方面,该

文模型使用纯卷积神经网络构建,而不是使用密集注意力机制,帧率比基于可变形的

DETR方法多8.18f/s。

关键词:无监督;开放世界;增量学习;目标检测

中图分类号:TP391文章编号:1000-565X(2025)03-0012-08

基于深度学习的目标检测在多个领域取得了显检测(OWOD)方法,开放世界目标检测任务不仅

[1-4]

著的进展。然而,传统的目标检测模型通常采要求检测器能够识别在训练集中未出现的物体,而

用闭集的设置,忽略了存在于数据集中但没有被标且要求检测器能在这些新检测出的物体上进行增量

注的物体,即未知对象。在某些情况下,检测未知学习。最早的OWOD模型使用区域提议网络(RPN)

对象是至关重要的。例如,自动驾驶汽车或机器人的对象分数来标记未知对象,并采用基于能量的分

[7]

需要检测未知的障碍物,以确保能够安全行驶。为类器来分离已知类别和未知类别。OW-DETR基

[5][4]

解决这一问题,Dhamija等提出了开放集合目标于可变形的DETR构建,利用中间特征生成的注

文档评论(0)

教师资格证、公共营养师持证人

本人专注ppt制作、办公模板编辑六年有余,可以根据客户需求做出高品质ppt、办公表格等模板,以及文案等。

领域认证该用户于2024年07月07日上传了教师资格证、公共营养师

1亿VIP精品文档

相关文档