基于视觉Transformer的遥感图像目标检测与旋转框回归设计_图像与视觉信息处理.docxVIP

基于视觉Transformer的遥感图像目标检测与旋转框回归设计_图像与视觉信息处理.docx

PAGE2

基于视觉Transformer的遥感图像目标检测与旋转框回归设计

第一章绪论

1.1研究背景

遥感图像目标检测在国防安全、城市规划、环境监测等领域发挥着不可替代的作用。随着高分辨率遥感卫星技术的快速发展，获取的遥感图像数据量呈指数级增长，图像空间分辨率已达到亚米级水平。

这一发展趋势使得遥感图像中的目标呈现出尺度差异大、分布密集、方向任意等特点。传统目标检测方法主要基于水平边界框进行定位，难以精确描述遥感图像中大量存在的旋转目标，如舰船、车辆和建筑物等。

水平框在密集排列场景下会产生严重的重叠问题，导致非极大值抑制过程中出现误删或漏检。同时，水平框包含大量背景区域，降低了目标定位的精确性和后续识别的可靠性。

现有检测方法在处理大尺度目标时，受限于卷积神经网络的局部感受野，难以有效捕捉长距离上下文信息。这种局部性约束使得模型对复杂场景的语义理解能力不足，制约了检测精度的进一步提升。

表1-1遥感图像目标检测面临的核心问题分析

问题类别

具体表现

产生原因

解决紧迫性

定位精度不足

旋转目标用水平框表示，交并比低

传统检测框架仅支持轴对齐框

极高

密集场景漏检

相邻目标框高度重叠，NMS误删

水平框在密集排列时重叠严重

高

大尺度目标感知弱

大目标上下文信息利用不充分

CNN局部感受野限制

高

方向信息缺失

无法获取目标的精确朝向

缺乏角度参数化建模

极高

背景

更多 >