面向视觉识别检测的自监督领域自适应方法.pdfVIP

面向视觉识别检测的自监督领域自适应方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

深度神经网络的训练往往需要大量有标签的数据。为了减少提供大量有标签

数据所带来的成本,研究者们提出了一系列领域自适应算法,探索将有标签的源

域上的知识迁移到无标签的目标域上。然而,这些方法走向实际应用时存在两个

关键挑战:一是传统的领域自适应算法在对齐不同领域的特征分布时,难以维护

好目标域样本的类别结构信息,导致其在具体任务中的判别能力变弱;二是在数

据隔离的场景下,源域数据和目标域数据无法直接进行匹配和对齐,目标域样本

表征的判别能力更难得到保证。尽管最近有工作提出基于伪标签技术解决该问

题,并在图像识别任务中取得了不错的实验结果,但在面对伪标签质量难以控制

的视觉任务例如目标检测时,这类方法难以奏效。

针对上述研究中的挑战,论文结合不同视觉任务的特点,分别提出了一种自

监督领域自适应算法增强目标域样本表征的判别能力。具体开展工作如下:

在源域数据和目标域数据非隔离的设定中,本文以图像识别为任务场景,提

出利用自监督学习中的对比学习构建类别原型表征,并将其作为参照物衡量成对

的目标域样本的相似性。在此基础上,本文提出了一个结构损失使相似的目标域

样本在特征空间更近,不相似的样本在特征空间更远。实验表明,通过维护这种

不同类别间的结构信息,本文算法有效地增强了目标域样本表征的判别能力。

在源域数据和目标域数据相互隔离的设定中,本文以伪标签情况复杂难控的

目标检测为任务场景,提出了利用自监督代理任务进行辅助对齐的算法。算法通

过自监督的图像旋转角度预测任务,让预训练好的源域模型对目标域数据分布进

行了学习。在此基础上,本文提出了域不变实例挖掘策略,从丰富的源域数据中

挑选具有良好域不变特征的实例样本对模型进行微调,在源域数据和目标域数据

无法汇聚的限制下实现了特征的对齐。通过对域不变实例的再学习,目标域实例

级别样本表征的判别能力得到了增强。多个公开基准数据集上的实验结果表明了

本文所提算法的有效性。

关键词:领域自适应,自监督学习,图像识别,目标检测

I

ABSTRACT

Thetrainingofdeepneuralnetworksoftenrequiresalargeamountoflabeleddata.

Toreducethecostofprovidinglargeamountsoflabeleddata,researchershavepro-

posedaseriesofdomainadaptationalgorithmstoexplorethetransferofknowledge

fromlabeledsourcedomainstounlabeledtargetdomains.However,therearetwokey

challengeswhenthesemethodsareappliedtopracticalapplications.First,thetraditional

domainadaptationalgorithmisdifficulttomaintainthecategorystructureinformation

ofthetargetdomainsampleswhenaligningthefeaturedistributionofdifferentdomains,

resultingintheweakeningofitsdiscriminationabilityinspecifictasks.Second,inthe

scenarioofdataisolation,thesourcedomaindataandthetargetdomaindatacannotbe

directlymatchedandaligned,andthediscriminantabilityofthetargetdomainsample

representationismoredifficulttobeguaranteed.Althoughrecentworkhasproposed

tosolvethisproblembasedonpseudo-labeltechnologyandachievedgoodexperimen-

talresultsinimagerecognitiontasks,suchmethodsaredifficulttoworkinthefaceof

visua

文档评论(0)

精品资料 + 关注
实名认证
文档贡献者

温馨提示:本站文档除原创文档外,其余文档均来自于网络转载或网友提供,仅供大家参考学习,版权仍归原作者所有,若有侵权,敬请原作者及时私信给我删除侵权文

1亿VIP精品文档

相关文档