- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN120088292B(45)授权公告日2025.07.04
(21)申请号202510582564.9
(22)申请日2025.05.07
(65)同一申请的已公布的文献号申请公布号CN120088292A
(56)对比文件
CN116310683CN115205730审查员王馨
A,2023.06.23A,2022.10.18
(43)申请公布日2025.06.03
(73)专利权人浙江师范大学
地址321000浙江省金华市婺城区迎宾大
道688号
(72)发明人张大伟王炫肖昕何小卫陈灏郑忠龙
(74)专利代理机构合肥甄慧知识产权代理事务
所(普通合伙)34370专利代理师黄珍丽
(51)Int.CI.
GO6F16/00(2019.01)权利要求书2页说明书10页附图10页
(54)发明名称
一种基于卷积注意力融合的RGBT目标跟踪方法
(57)摘要
CN120088292B本发明公开了一种基于卷积注意力融合的RGBT目标跟踪方法,属于计算机视觉技术领域,包括以下步骤:步骤一、视频预处理;步骤二、特征提取:通过线性映射和Transformer编码器将输入图像信息编码为特征序列;步骤三、局部特征增强与融合:通过滑动窗口来选定局部区域,将当前模态的局部特征与另一个模态全局特征进行交叉注意力计算,从而实现局部特征增强,并有效融合了跨模态信息;步骤四、目标跟踪预测。本发明通过对局部特征信息的充分提取与融合,实现了更稳定的RGBT目标跟踪,在多个视频
CN120088292B
算法。
预测头
预测头
TransformerTransformer
编码器编码器
TransformerTransformer
编码器编码器
卷积注意力融合模块
TransformerTransformer
编码器编码器
线性映射
CN120088292B权利要求书1/2页
2
1.一种基于卷积注意力融合的RGBT目标跟踪方法,其特征在于,包括以下步骤:
步骤一、视频预处理;
在数据集中随机选取一段视频序列,其中每一帧为一张图像;在可见光与热红外模态的第一帧的相同位置选定目标所在的矩形区域,将该区域缩放,并保存作为该视频序列的目标模板;从第二帧起,以上一帧目标位置为中心点,选取范围大于目标所在区域的正方形区域,并缩放后作为当前帧的搜索区域;
步骤二、特征提取;
将可见光与热红外模态的目标模板与搜索区域切割为若干区块并展开拼接,通过线性映射层将图像信息映射为一维特征序列,并向其加入全局位置编码;对两个模态的特征分别使用参数共享的主干网络的Transformer编码器提取特征;
主干网络采用OSTrack作为基线模型并扩展为双分支,令原始输入的可见光、热红外特征分别为X、X,第i层Transformer编码器表示为Encoder2,特征提取过程可公式化表达为:
其中,表示第i层可见光特征,Xi表示第i层热红外特征,表示第(i+1)层可见
光特征,表示第(i+1)层热红外特征;
步骤三、局部特征增强与融合;
在Transformer编码器之间插入卷积注意力融合模块:通过滑动窗口将一维特征序列进行二维化处理,随后在其周围进行零填充,使用滑动窗口从左上角开始循环滑动,滑动窗口遍历整个特征图,选定局部区域;将局部区域序列化并计算可见光与热红外模态的局部交叉注意力;最后将各个滑动窗口的局部交叉注意力结果进行合并;
通过滑动窗口选定局部区域,具体步骤如下:
对干输入的一维线性特征序列X∈R(HXW)×C.将其展开为二维特征.并通过零填充将其扩展至(H+2×padding)×(W+2×padding),其中,H、W、C分别为原始特征图的高、宽和通道数,padding为填充大小;将扩展后的区域分割为p×p的区块,将每个区块视为一个维数为P∈RD×p×C的特征点,其中,P
您可能关注的文档
- CN115908842B 变压器局部放电数据增强与识别方法 (淮南市潘阳光伏发电有限公司).docx
- CN115909040B 一种基于自适应多特征融合模型的水声目标识别方法 (西安邮电大学).docx
- CN116068900B 面向多非完整约束移动机器人的强化学习行为控制方法 (福州大学).docx
- CN116072134B 基于dct-ddpm的音乐音频修复方法及系统 (四川大学).docx
- CN116125285B 基于单体间流量不均匀性的液流电池性能预测方法 (西安交通大学).docx
- CN116163798B 一种采空区下长壁工作面开采覆岩离层注浆方法 (安徽理工大学).docx
- CN116171156B 含嘧啶基团的三并环类化合物的盐型、晶型及其制备方法 (江苏奥赛康药业有限公司).docx
- CN116273416B 一种聚丙烯酸钠水凝胶助磨剂及其制备方法和应用 (江西广源化工有限责任公司).docx
- CN116377477B 用于大电流二氧化碳电催化产乙烯的石墨烯量子点负载CuO催化剂及其制备方法与应用 (华南理工大学).docx
- CN116381649B 联合标定方法、设备和存储介质 (烟台艾睿光电科技有限公司).docx
- 2026年中国龙门磨床身行业市场数据调查、监测研究报告.docx
- 2026年中国牛二层反毛皮行业市场数据调查、监测研究报告.docx
- 2026年中国风扇护罩行业市场数据调查、监测研究报告.docx
- 2026年中国交变负荷试验机行业市场数据调查、监测研究报告.docx
- 2026年中国水净化器行业市场数据调查、监测研究报告.docx
- 2026年中国游戏机BGA测试治具行业市场数据调查、监测研究报告.docx
- 2026年中国单组份胶粘剂行业市场数据调查、监测研究报告.docx
- 2026年中国船舶止推瓦行业市场数据调查、监测研究报告.docx
- 2026年中国全自动双重石英高纯水蒸馏器行业市场数据调查、监测研究报告.docx
- 2026年中国橄榄柔润洗面膏行业市场数据调查、监测研究报告.docx
最近下载
- 智慧矿山整体项目解决方案.docx VIP
- Markem-Imaje马肯依玛士 9018使用说明.pdf VIP
- 基于独居石裂变径迹的测年方法.pdf VIP
- 2025年时政热点知识试题库(附含答案).docx VIP
- DB11T 1811-2020 厨房、厕浴间防水技术规程.docx VIP
- 2023版《检验检测机构资质认定评审准则》课件.pptx
- 检验检测机构内部审核和管理评审.pptx VIP
- (二诊)泸州市高2022级(2025届)高三第二次教学质量诊断性考试 政治试卷(含答案.docx
- 8 ISO 12944-5中文版 色漆和清漆防护漆体系对钢结构的腐蚀防护 第5部分 防护涂料系列.pdf VIP
- Aqara绿米智能门锁 N200产品手册说明书.pdf
原创力文档


文档评论(0)