面向视觉识别检测的自监督领域自适应方法.pdfVIP

下载本文档

1
0
约9.13万字
约 58页
2025-09-26 发布于江西
举报
版权申诉

面向视觉识别检测的自监督领域自适应方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

深度神经网络的训练往往需要大量有标签的数据。为了减少提供大量有标签

数据所带来的成本，研究者们提出了一系列领域自适应算法，探索将有标签的源

域上的知识迁移到无标签的目标域上。然而，这些方法走向实际应用时存在两个

关键挑战：一是传统的领域自适应算法在对齐不同领域的特征分布时，难以维护

好目标域样本的类别结构信息，导致其在具体任务中的判别能力变弱；二是在数

据隔离的场景下，源域数据和目标域数据无法直接进行匹配和对齐，目标域样本

表征的判别能力更难得到保证。尽管最近有工作提出基于伪标签技术解决该问

题，并在图像识别任务中取得了不错的实验结果，但在面对伪标签质量难以控制

的视觉任务例如目标检测时，这类方法难以奏效。

针对上述研究中的挑战，论文结合不同视觉任务的特点，分别提出了一种自

监督领域自适应算法增强目标域样本表征的判别能力。具体开展工作如下：

在源域数据和目标域数据非隔离的设定中，本文以图像识别为任务场景，提

出利用自监督学习中的对比学习构建类别原型表征，并将其作为参照物衡量成对

的目标域样本的相似性。在此基础上，本文提出了一个结构损失使相似的目标域

样本在特征空间更近，不相似的样本在特征空间更远。实验表明，通过维护这种

不同类别间的结构信息，本文算法有效地增强了目标域样本表征的判别能力。

在源域数据和目标域数据相互隔离的设定中，本文以伪标签情况复杂难控的

目标检测为任务场景，提出了利用自监督代理任务进行辅助对齐的算法。算法通

过自监督的图像旋转角度预测任务，让预训练好的源域模型对目标域数据分布进

行了学习。在此基础上，本文提出了域不变实例挖掘策略，从丰富的源域数据中

挑选具有良好域不变特征的实例样本对模型进行微调，在源域数据和目标域数据

无法汇聚的限制下实现了特征的对齐。通过对域不变实例的再学习，目标域实例

级别样本表征的判别能力得到了增强。多个公开基准数据集上的实验结果表明了

本文所提算法的有效性。

关键词：领域自适应，自监督学习，图像识别，目标检测

ABSTRACT

Thetrainingofdeepneuralnetworksoftenrequiresalargeamountoflabeleddata.

Toreducethecostofprovidinglargeamountsoflabeleddata,researchershavepro-

posedaseriesofdomainadaptationalgorithmstoexplorethetransferofknowledge

fromlabeledsourcedomainstounlabeledtargetdomains.However,therearetwokey

challengeswhenthesemethodsareappliedtopracticalapplications.First,thetraditional

domainadaptationalgorithmisdifficulttomaintainthecategorystructureinformation

ofthetargetdomainsampleswhenaligningthefeaturedistributionofdifferentdomains,

resultingintheweakeningofitsdiscriminationabilityinspecifictasks.Second,inthe

scenarioofdataisolation,thesourcedomaindataandthetargetdomaindatacannotbe

directlymatchedandaligned,andthediscriminantabilityofthetargetdomainsample

representationismoredifficulttobeguaranteed.Althoughrecentworkhasproposed

tosolvethisproblembasedonpseudo-labeltechnologyandachievedgoodexperimen-

talresultsinimagerecognitiontasks,suchmethodsaredifficulttoworkinthefaceof

visua

您可能关注的文档

文档评论（0）

精品资料 + 关注: 实名认证

文档贡献者

温馨提示：本站文档除原创文档外，其余文档均来自于网络转载或网友提供，仅供大家参考学习，版权仍归原作者所有，若有侵权，敬请原作者及时私信给我删除侵权文

咨询Ta 进入空间

1亿VIP精品文档

更多 >

面向视觉识别检测的自监督领域自适应方法.pdfVIP