通过深度排序帧学习选择引导帧进行对象分割.pdfVIP

下载本文档

0
0
约10.65万字
约 24页
2026-01-20 发布于北京
举报
版权申诉

通过深度排序帧学习选择引导帧进行对象分割.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

BubbleNets：通过深度排序帧学习选择帧进行视

频对象分割

BrentA.GriffinJasonJ.

Corso密歇根大学{griffb,jjcorso}

@umich.edu

半监督对象分割在近年来对且具有性

的上取得了显著进展。当前的分割方法和基准数据

集范式是在中第一帧的单个注释来分割对象。

然而，我们发现，当选择其他帧进行注释时，整个

的分割性能会大幅波动。本文解决了学习建议中最

佳单帧供用户注释的问题——实际上，这从来不是

的第一帧。我们通过引入BubbleNets，一种新颖的深

度排序网络，该网络使用基于性能的损失函数，能够从

已存在的数据集中转换大量训练示例。利用

图1.当前对象分割的范式是在的第一帧中标注一个

BubbleNets，我们能够在DAVIS基准上实现11%的相

对象（，左）。然而，选择不同的帧进行标注会改变整

对分割性能提升，而无需对底层分割方法进行任何更改。

个的性能[更好（绿色）或更差（红色）]。为了最有效

地利用标注者的时间，我们的深度排序框架建议一个能够提

高分割性能的帧。

关键在于通过最佳的单帧注释来提高半监督

VOS方法的性能。然而，我们没有发现任何关于学习

1.引言选择哪个帧进行注释以用于VOS的工作。

对象分割（VOS），即从背景中密集分离为此，本文解决了选择单个帧进行注释的问

中的对象，仍然是理解领域的一个热门研究方向。鉴题，以实现更高的性能。从处理的开始，我

于在中进行密集注释的用户分割成本高昂[5,38],我们使用我们的深度气泡排序框架选择一个注释帧，该

们的社区正在开发许多新的VOS方法，并定期在支持框架通过我们的自定义网络BubbleNets对帧对之间的

VOS研究的基准数据集上进行评估[22,31,33,37,45]。相对性能进行预测。BubbleNets迭代地比较并交换相

与无监督VOS相比[12,21,29,44],半监督VOS，即在给邻的帧，直到预测性能最高的帧最高，此时，

定单个用户标注帧的情况下对中的对象进行分割的问

它被选中供用户注释并用于VOS。为了训练

题，已经取得了迅猛的发展，即使在过去一年内也是如此

BubbleNets，我们使用了一种创新的基于相对性能的

[2,4,7,8,9,16,17,25,28,30,35,46]。

损失函数，该方法在不增加帧要求的情况下，将

中物体的位置和外观在帧与帧之间可能会发训练样本的数量增加了几个数量级。最后，我们在多

生显著变化，通过我们自己的分析，我们发现使用不个VOS数据集上评估了BubbleNets的注释帧选择，并

同的帧进行注释会显著改变性能，如图1所示。注释视实现了高达11%的联合Jaccard指数和区域轮廓准确性

频数据是一个艰巨的过程，因此的相对改进，

您可能关注的文档

文档评论（0）

136****1820 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

通过深度排序帧学习选择引导帧进行对象分割.pdfVIP