CN114693952B 一种基于多模态差异性融合网络的rgb-d显著性目标检测方法 (安徽理工大学).docxVIP

CN114693952B 一种基于多模态差异性融合网络的rgb-d显著性目标检测方法 (安徽理工大学).docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN114693952B(45)授权公告日2025.07.01

(21)申请号202210308520.3

(22)申请日2022.03.24

(65)同一申请的已公布的文献号申请公布号CN114693952A

(43)申请公布日2022.07.01

(73)专利权人安徽理工大学

地址232001安徽省淮南市山南新区泰丰

大街168号

GO6V10/80(2022.01)

GO6V10/82(2022.01)GO6V10/774(2022.01)G06N3/048(2023.01)

(56)对比文件

CN113076957A,2021.07.06CN114170174A,2022.03.11审查员王宛生

(72)发明人夏晨星段松松黄荣梅孙延光段秀真王晶晶

(51)Int.CI.

GO6V10/46(2022.01)

GO6N3/0464(2023.01)

GO6N3/0455(2023.01)

GO6N3/084(2023.01)

权利要求书2页说明书7页附图3页

(54)发明名称

一种基于多模态差异性融合网络的RGB-D显著性目标检测方法

(57)摘要

CN114693952B本发明提供一种基于多模态差异性融合网络的RGB-D显著性目标检测方法,属于图像显著性检测技术,所述方法利用SwinTransformer提取包含全局上下文信息的RGB和Depth特征,用于给出场景的显著性目标推理。本发明主要通过探索RGB和Depth模态之间的差异性分析显著性在这两个模态的联系和区别,并设计一个差异性融合网络融合跨模态特征用于捕获完整的显著目标。本发明包括以下几个步骤:(1)采用SwinTransformer提取跨模态特征;(2)使用双向融合方式融合RGB和Depth特征生成

CN114693952B

(4)利用该差异性融合跨模态特征;(5)使用目级联聚合解码器对融合的跨模态特征进行显著性的推理和解码,生成预测的显著性图。

RCOHfano。

CN114693952B权利要求书1/2页

2

1.一种基于多模态差异性融合网络的RGB-D显著性目标检测方法,其特征在于,该方法包含以下步骤:

1)利用深度学习中的SwinTransformer网络作为RGB和Depth编码器用于提取RGB和Depth图像的层次化视觉特征,其中,SwinTransformer编码器由四个基本的SwinTransformerblock组成,其定义如下所示:

S=MLP(LN(W(LN(F?))+F?))+W(LN(F?))+F公式(1)

ST=MLP(LN(W(LN(S))+S))+W(LN(S))+S,公式(2)

其中,MLP表示多层感知机,LN表示层次化归一,w.代表多头自注意力机制,w表示基于转换窗口自注意力机制;RGB和Depth编码器的输出,分别记作,RGB特征

2)跨模态双向融合模块用于初步融合跨模态的特征,为下一阶段的三流差异性监督机制做好准备;

3)构建三流差异性监督机制用于实现多模态之间的差异性融合,表示为三个分支,分别表示为RGB分支,Depth分支,和Fusion分支:

3.1)构建三流差异性监督机制中的RGB分支,并采用级联聚合解码器预测显著性图;在RGB特征输入到CAD之前,利用ASPP技术强化RGB特征的感受野,增强RGB特征的全局信息,并使用显著目标分割图Sc进行监督学习,RGB分支的操作描述如下所示:

公式(3)

其中,CAD表示级联聚合解码器,A表示ASPP技术,表示RGB分支预测出的显著性图;

3.2)采用级联聚合解码器预测显著性图,在Depth特征输入到级联聚合解码器之前,利用ASPP技术强化Depth特征的感受野,增强Depth特征的全局信息,并使用显著目标分割图

Sc-进行监督学习,Depth分支的操作描述如下所示:

公式(4)

其中,CAD表示级联聚合解码器,A表示ASPP技术,表示RGB分支预测出的显著性

图;

3.3)基于步骤2.2所生成的跨模态融合特征,使用获取到的

您可能关注的文档

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档