- 0
- 0
- 约1.8万字
- 约 33页
- 2026-01-20 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN116721398B(45)授权公告日2025.07.11
(21)申请号202310865846.0
(22)申请日2023.07.14
(65)同一申请的已公布的文献号申请公布号CN116721398A
(43)申请公布日2023.09.08
(73)专利权人长沙理工大学
地址410114湖南省长沙市雨花区万家丽
南路二段960号
(72)发明人张建明易尧王祖楼
(74)专利代理机构长沙智路知识产权代理事务所(普通合伙)43244
专利代理师张毅
(51)Int.CI.
GO6V20/56(2022.01)
GO6V10/80(2022.01)
GO6V10/82(2022.01)
GO6N3/0464(2023.01)
GO6N3/08(2023.01)
(56)对比文件
CN114202672A,2022.03.18CN114943876A,2022.08.26
审查员夏冰
权利要求书3页说明书10页附图4页
(54)发明名称
一种基于跨阶段路由注意力模块和残差信息融合模块的Yolov5目标检测方法
(57)摘要
CN116721398B本发明公开了一种基于跨阶段路由注意力模块和残差信息融合模块的Yolov5目标检测方法,该方法通过对原有Yolov5的骨干、颈部、解耦网络的结构进行优化改进,使得检测器能够充分融合多尺度特征信息和增强对交通标志这类小目标的检测,注重对浅层特征图使用,更有利于对小目标的检测,同时只使用两个检测解耦头的方法以达到更高的精度。该方法能够有效的应对光照变化,形变,尺度变化,干扰物影响等多种挑
CN116721398B
CN116721398B权利要求书1/3页
2
1.一种基于跨阶段路由注意力模块和残差信息融合模块的Yolov5目标检测方法,其特征在于,该方法对原有的Yolov5网络进行了改进,具体包括:
(1)跨阶段路由注意力模块
在Yolov5网络中,将骨干网络中的第6层和第8层的C3模块都替换为跨阶段路由注意力模块,且将第2层、第4层、第6层和第9层的特征图信息依次作为输入信号P2、P3、P4和P5输入到颈部网络中;所述跨阶段路由注意力模块的构成方式为:首先将特征图的通道数一份为二,第一部分通过注意力机制进行特征增强信息,另一部分则经过跨阶段与增强后的特征进行输出合并,最后再使用残差结构进行语义的局部增强;
(2)多尺度特征融合方法
颈部网络中,通过骨干网络得到i代表骨干网络中提取的第i层特征图,i∈{0,1,3,4},f?~f?分别对应于输入信号P5~P2,其中C?∈{1024,512,256,128};S;代表经过多级信息融合模块后的输出的结果,其经过多尺度特征融合网络的数学化公式表示为:
S?=f。
S=MRI(fi,Si-1)i=1,4
S=MRI(f,Si-1,f:+1)i=2,3
S=MRI(Si-3,Si-4)i=5,7
S=MRI(Si-3,Si-4,Si-1)i=6
其中,MRI函数的含义是多尺度的特征融合模块函数,能基于拼接和上采样进行各个参数的多尺度特征的融合;
(3)双分支预测解耦头
解耦头中,使用了颈部网络中相对更浅的P2和P3层对应的特征图的两层输出,以将其分别进行双分支预测解耦输出作为最终的预测结果。
2.根据权利要求1所述的基于跨阶段路由注意力模块和残差信息融合模块的Yolov5目标检测方法,其特征在于,所述跨阶段路由注意力模块中的注意力机制为改进设计的BRA注意力机制,所述BRA注意力机制的构成方式为:
BRA注意力机制中,任取单元X∈RC×H×W作为输入,以Y∈RC×H×W作为输出,首先将特征图
划分为P×P块相互不重叠的区域,然后将这些区域按照空间维度展平,得到个特征向量,然后将得到的特征向量输入通过线性映射推导出其中C是特征
图的通道数,H和W分别是特征图的宽和高,P是特征图划分的块数;Q=XW?,K=XwK,V=XW
这里的W°,wK,W∈R×C都是参数矩阵,代表映射图像中Query,Key,Value的线性映射权重矩阵,然后将Q与K的按特征向量划分的区域求平均值得到Qr,Kr∈RP2×c;
A?=Mean(Q)×Mean(
您可能关注的文档
- CN115240578B 命令模式与视频模式间无缝切换的方法和装置及显示装置 (美格纳智芯混合信号有限公司).docx
- CN115271161B 一种多能负荷短期预测方法 (华南理工大学).docx
- CN115309195B 一种光伏跟踪轴的控制方法、装置及光伏跟踪系统 (仁卓智能科技有限公司).docx
- CN115309814B 基于结构化低秩张量补全的物联网数据重建方法 (河北工业大学).docx
- CN115310378B 一种极端台风灾害下电网韧性评估及差异化规划方法 (武汉大学).docx
- CN115330663B 眼前节oct图像中巩膜镜和泪液镜边界分割方法 (温州医科大学).docx
- CN115344041B 一种自移动装置的控制方法、自移动装置及自移动设备 (科沃斯机器人股份有限公司).docx
- CN115346463B 一种图像显示方法及装置 (北京奕斯伟计算技术股份有限公司).docx
- CN115408860B 一种风电场风速-功率数据的异常值监测及修正方法 (河北工业大学).docx
- CN115455382B 一种二进制函数代码的语义比对方法及装置 (武汉大学).docx
- 名山河流土壤粒径在有机质去除前后对铬(Ⅵ)吸附的影响研究.docx
- 基于声发射技术洞察缸套—活塞环润滑状态的深度研究.docx
- 多维视角下城市快速公交线网布局的科学构建与优化策略研究.docx
- 尿毒康合剂治疗急性肾损伤:从动物实验到临床疗效的深度剖析.docx
- 高频超声在肘管综合征中的临床应用:多维度分析与展望.docx
- 剪切速率对岩石节理力学特性的影响及机制研究.docx
- 论标准必要专利禁令救济限制:基于利益平衡与公共政策的考量.docx
- 次氯酸荧光探针:从合成基石到多元应用的深度探索.docx
- 晶体拉曼放大器与反斯托克斯激光器:理论探究与实验验证.docx
- 分布式防火墙策略分发与分类:技术剖析与优化策略.docx
原创力文档

文档评论(0)