- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
深度神经网络的训练往往需要大量有标签的数据。为了减少提供大量有标签
数据所带来的成本,研究者们提出了一系列领域自适应算法,探索将有标签的源
域上的知识迁移到无标签的目标域上。然而,这些方法走向实际应用时存在两个
关键挑战:一是传统的领域自适应算法在对齐不同领域的特征分布时,难以维护
好目标域样本的类别结构信息,导致其在具体任务中的判别能力变弱;二是在数
据隔离的场景下,源域数据和目标域数据无法直接进行匹配和对齐,目标域样本
表征的判别能力更难得到保证。尽管最近有工作提出基于伪标签技术解决该问
题,并在图像识别任务中取得了不错的实验结果,但在面对伪标签质量难以控制
的视觉任务例如目标检测时,这类方法难以奏效。
针对上述研究中的挑战,论文结合不同视觉任务的特点,分别提出了一种自
监督领域自适应算法增强目标域样本表征的判别能力。具体开展工作如下:
在源域数据和目标域数据非隔离的设定中,本文以图像识别为任务场景,提
出利用自监督学习中的对比学习构建类别原型表征,并将其作为参照物衡量成对
的目标域样本的相似性。在此基础上,本文提出了一个结构损失使相似的目标域
样本在特征空间更近,不相似的样本在特征空间更远。实验表明,通过维护这种
不同类别间的结构信息,本文算法有效地增强了目标域样本表征的判别能力。
在源域数据和目标域数据相互隔离的设定中,本文以伪标签情况复杂难控的
目标检测为任务场景,提出了利用自监督代理任务进行辅助对齐的算法。算法通
过自监督的图像旋转角度预测任务,让预训练好的源域模型对目标域数据分布进
行了学习。在此基础上,本文提出了域不变实例挖掘策略,从丰富的源域数据中
挑选具有良好域不变特征的实例样本对模型进行微调,在源域数据和目标域数据
无法汇聚的限制下实现了特征的对齐。通过对域不变实例的再学习,目标域实例
级别样本表征的判别能力得到了增强。多个公开基准数据集上的实验结果表明了
本文所提算法的有效性。
关键词:领域自适应,自监督学习,图像识别,目标检测
I
ABSTRACT
Thetrainingofdeepneuralnetworksoftenrequiresalargeamountoflabeleddata.
Toreducethecostofprovidinglargeamountsoflabeleddata,researchershavepro-
posedaseriesofdomainadaptationalgorithmstoexplorethetransferofknowledge
fromlabeledsourcedomainstounlabeledtargetdomains.However,therearetwokey
challengeswhenthesemethodsareappliedtopracticalapplications.First,thetraditional
domainadaptationalgorithmisdifficulttomaintainthecategorystructureinformation
ofthetargetdomainsampleswhenaligningthefeaturedistributionofdifferentdomains,
resultingintheweakeningofitsdiscriminationabilityinspecifictasks.Second,inthe
scenarioofdataisolation,thesourcedomaindataandthetargetdomaindatacannotbe
directlymatchedandaligned,andthediscriminantabilityofthetargetdomainsample
representationismoredifficulttobeguaranteed.Althoughrecentworkhasproposed
tosolvethisproblembasedonpseudo-labeltechnologyandachievedgoodexperimen-
talresultsinimagerecognitiontasks,suchmethodsaredifficulttoworkinthefaceof
visua
文档评论(0)