- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114693952B(45)授权公告日2025.07.01
(21)申请号202210308520.3
(22)申请日2022.03.24
(65)同一申请的已公布的文献号申请公布号CN114693952A
(43)申请公布日2022.07.01
(73)专利权人安徽理工大学
地址232001安徽省淮南市山南新区泰丰
大街168号
GO6V10/80(2022.01)
GO6V10/82(2022.01)GO6V10/774(2022.01)G06N3/048(2023.01)
(56)对比文件
CN113076957A,2021.07.06CN114170174A,2022.03.11审查员王宛生
(72)发明人夏晨星段松松黄荣梅孙延光段秀真王晶晶
(51)Int.CI.
GO6V10/46(2022.01)
GO6N3/0464(2023.01)
GO6N3/0455(2023.01)
GO6N3/084(2023.01)
权利要求书2页说明书7页附图3页
(54)发明名称
一种基于多模态差异性融合网络的RGB-D显著性目标检测方法
(57)摘要
CN114693952B本发明提供一种基于多模态差异性融合网络的RGB-D显著性目标检测方法,属于图像显著性检测技术,所述方法利用SwinTransformer提取包含全局上下文信息的RGB和Depth特征,用于给出场景的显著性目标推理。本发明主要通过探索RGB和Depth模态之间的差异性分析显著性在这两个模态的联系和区别,并设计一个差异性融合网络融合跨模态特征用于捕获完整的显著目标。本发明包括以下几个步骤:(1)采用SwinTransformer提取跨模态特征;(2)使用双向融合方式融合RGB和Depth特征生成
CN114693952B
(4)利用该差异性融合跨模态特征;(5)使用目级联聚合解码器对融合的跨模态特征进行显著性的推理和解码,生成预测的显著性图。
RCOHfano。
CN114693952B权利要求书1/2页
2
1.一种基于多模态差异性融合网络的RGB-D显著性目标检测方法,其特征在于,该方法包含以下步骤:
1)利用深度学习中的SwinTransformer网络作为RGB和Depth编码器用于提取RGB和Depth图像的层次化视觉特征,其中,SwinTransformer编码器由四个基本的SwinTransformerblock组成,其定义如下所示:
S=MLP(LN(W(LN(F?))+F?))+W(LN(F?))+F公式(1)
ST=MLP(LN(W(LN(S))+S))+W(LN(S))+S,公式(2)
其中,MLP表示多层感知机,LN表示层次化归一,w.代表多头自注意力机制,w表示基于转换窗口自注意力机制;RGB和Depth编码器的输出,分别记作,RGB特征
2)跨模态双向融合模块用于初步融合跨模态的特征,为下一阶段的三流差异性监督机制做好准备;
3)构建三流差异性监督机制用于实现多模态之间的差异性融合,表示为三个分支,分别表示为RGB分支,Depth分支,和Fusion分支:
3.1)构建三流差异性监督机制中的RGB分支,并采用级联聚合解码器预测显著性图;在RGB特征输入到CAD之前,利用ASPP技术强化RGB特征的感受野,增强RGB特征的全局信息,并使用显著目标分割图Sc进行监督学习,RGB分支的操作描述如下所示:
公式(3)
其中,CAD表示级联聚合解码器,A表示ASPP技术,表示RGB分支预测出的显著性图;
3.2)采用级联聚合解码器预测显著性图,在Depth特征输入到级联聚合解码器之前,利用ASPP技术强化Depth特征的感受野,增强Depth特征的全局信息,并使用显著目标分割图
Sc-进行监督学习,Depth分支的操作描述如下所示:
公式(4)
其中,CAD表示级联聚合解码器,A表示ASPP技术,表示RGB分支预测出的显著性
图;
3.3)基于步骤2.2所生成的跨模态融合特征,使用获取到的
您可能关注的文档
- (正式版)DB3311∕T 167-2021 《工程建设项目劳动者工资支付管理规范》.pdf
- (正式版)DB3311∕T 168-2021 《数字文化馆建设与服务规范 》.pdf
- (正式版)DB3311∕T 170-2021 《政银保农户小额贷款管理指南 》.pdf
- (正式版)DB3311∕T 173-2021 《中黄2号茶树栽培技术规程》.pdf
- (正式版)DB3311∕T 174-2021 《硬质桃生产技术规程 》.pdf
- (正式版)DB3311∕T 177-2021 《城区公共文化场馆美化建设规范》.pdf
- (正式版)DB3311∕T 180-2021 《菜豆绿色栽培技术规程 》.pdf
- (正式版)DB3311∕T 186-2021 《民族乡村振兴示范村建设与评价》.pdf
- (正式版)DB3311∕T 189-2021 《皇菊栽培技术规程 》.pdf
- (正式版)DB3311∕T 191-2021 《多花黄精种苗繁育技术规程》.pdf
- CN114694085B 换电排队车辆的数量识别方法、系统、设备及介质 (奥动新能源股份有限公司).docx
- CN114707060B 导航路线推荐方法、基于位置的服务提供方法及程序产品 (高德软件有限公司).docx
- CN114707452B 一种基于协程的数字仿真验证方法、设备和存储介质 (芯华章科技股份有限公司).docx
- CN114708601B 一种基于深度学习的手写字擦除方法 (南京大学).docx
- CN114723383B 信息处理装置、信息处理系统、信息处理方法及终端装置 (丰田自动车株式会社).docx
- CN114728657B 车辆控制方法及车辆控制装置 (日产自动车株式会社).docx
- CN114728766B 用于确定电梯设备的吊具结构的部件的磨损状态的方法 (因温特奥股份公司).docx
- CN114730701B 包括嵌入接合焊盘的扩散阻挡层的半导体裸片及其形成方法 (桑迪士克科技股份有限公司).docx
- CN114744287B 一种硫化物固态电解质的制备方法及其应用 (上海屹锂新能源科技有限公司).docx
- CN114753012A 一种棉化工业大麻纤维的制备方法 (齐齐哈尔大学).docx
最近下载
- 2022-2023学年江苏苏州昆山市五年级上册英语期末试卷及答案译林版.pdf
- 《经济学基础》课程标准.pdf
- 卫生院老年人体检培训.pptx VIP
- X线检查技术(医学影像技术):X线造影检查PPT教学课件.pptx
- 黄帝内经_白话文.pdf VIP
- 2026全新《低血糖》ppt课件.pptx VIP
- 2025年呼吸机相关性肺炎诊断预防和治疗指南(2025).pptx VIP
- 2024年初中语文万能作文开头结尾的技巧附40个主题高分范例+50个首尾相应严谨范例 .docx VIP
- Tektronix万用表DMM7510-900-03C 用户手册.pdf
- 南京市玄武区2023-2024学年七年级上学期期末道德与法治试卷(含答案解析).docx VIP
原创力文档


文档评论(0)