CN115375668B 基于注意力机制的红外单帧小目标检测方法 (西安电子科技大学).docxVIP

  • 0
  • 0
  • 约1.91万字
  • 约 30页
  • 2026-01-19 发布于重庆
  • 举报

CN115375668B 基于注意力机制的红外单帧小目标检测方法 (西安电子科技大学).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN115375668B(45)授权公告日2025.07.04

(21)申请号202211086622.1

(22)申请日2022.09.07

(65)同一申请的已公布的文献号申请公布号CN115375668A

(43)申请公布日2022.11.22

(73)专利权人西安电子科技大学

地址710071陕西省西安市太白南路2号

(72)发明人王柯俨吴雪岩周培诚杨丽鋆

张铭津刘凯李云松

(74)专利代理机构陕西电子工业专利中心

GO6N3/045(2023.01)

GO6N3/0464(2023.01)

GO6N3/084(2023.01)

(56)对比文件

CN113065558A,2021.07.02CN114863097A,2022.08.05审查员隗仁然

61205

专利代理师王品华

(51)Int.CI.

GO6V10/82(2022.01)

GO6V10/80(2022.01)权利要求书3页说明书8页附图4页

(54)发明名称

基于注意力机制的红外单帧小目标检测方

(57)摘要

CN115375668B本发明公开了一种基于注意力机制的红外单帧小目标检测方法,主要解决现有技术模型泛化能力较差且存在严重误检、检测率较低及虚警较高的问题。其实现方案是:从公开数据集中选择带标注的数据集,对其预处理为尺寸统一的训练集和测试集;构建由编码端解码端交互引导模块、虚警注意模块和主干网络组成的多维度注意力感知网络;将训练集及其标注信息按批量大小分别平分为多个配对图像组,并依次循环输入多次至多维度注意力感知网络完成训练;将测试集输入至训练完成的多维度注意力感知网络,输出红外小目标检测结果。本发明对目标大小和场景变化具有很高的鲁棒性,能够在提高检测率的同时有效降低虚警率,可用于复杂背景下红外小目

CN115375668B

开始

开始

数据集预处理及数据集划分

训练集

在Pytorch框架下构建多维度注意力感知网络MDA-Net

训练MDA-Net网络,保存参数

更参,数达到预设epoch

测试集

用训练后的模型进行测试

结束

CN115375668B权利要求书1/3页

2

1.一种基于注意力机制的红外单帧小目标检测方法,其特征在于,包括如下步骤:

(1)从公开的红外小目标数据集中选择一组带标注的数据集,并依次进行在0.7~1.7范围内的随机放缩、随机裁剪或零填充操作,得到尺寸统一为480×480的训练集和测试集数据集;

(2)在Pytorch框架下构建多维度注意力感知网络MDA-Net:

(2a)建立由一个浅层通道注意力子模块、一个深层通道注意力子模块和一个逐点注意力子模块组成的编码端解码端交互引导模块EDIG;

(2b)建立由非局部注意力模块与非局部特征融合模块连接组成的虚警注意模块AFF;

(2c)选用现有的三个卷积操作单元、一个最大池化操作单元、两个上采样模块、十八个残差块构成一个八层编解码结构的主干网络;

(2d)将两个(2a)中构建的EDIG模块、一个(2b)中构建的AFF模块嵌入到八层编解码结构的主干网络中,组成Pytorch框架下的多维度注意力感知网络,并将IoULoss函数作为该网络的损失函数;

(3)采用训练集及其标注信息通过梯度下降法对多维度注意力感知网络进行训练,得到训练好的多维度注意力感知网络;

(4)将测试集输入到训练好的多维度注意力感知网络中,输出红外小目标检测结果。

2.根据权利要求1所述的方法,其特征在于:步骤(2a)中建立的编码端解码端交互引导模块EDIG,其结构关系如下:

将浅层通道注意力子模块和深层通道注意力子模块分别与逐点注意力子模块的浅层输入端口和深层输入端口对应连接,且该深层通道注意力子模块和浅层通道注意力子模块的输出结果再逐像素相乘后与逐点注意力子模块输出的结果进行相加,相加后的结果即为编码端解码端交互引导EDIG模块的输出结果;

所述浅层通道注意力子模块和深层通道注意力子模块结构相同,两者均包括全局平均池化层、两个全连接层、ReLU激活函数层和sigmoid

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档