基于视觉Transformer的遥感图像目标检测与旋转框回归设计_图像与视觉信息处理.docxVIP

  • 1
  • 0
  • 约1.61万字
  • 约 23页
  • 2026-05-22 发布于广东
  • 举报

基于视觉Transformer的遥感图像目标检测与旋转框回归设计_图像与视觉信息处理.docx

PAGE2

基于视觉Transformer的遥感图像目标检测与旋转框回归设计

第一章绪论

1.1研究背景

遥感图像目标检测在国防安全、城市规划、环境监测等领域发挥着不可替代的作用。随着高分辨率遥感卫星技术的快速发展,获取的遥感图像数据量呈指数级增长,图像空间分辨率已达到亚米级水平。

这一发展趋势使得遥感图像中的目标呈现出尺度差异大、分布密集、方向任意等特点。传统目标检测方法主要基于水平边界框进行定位,难以精确描述遥感图像中大量存在的旋转目标,如舰船、车辆和建筑物等。

水平框在密集排列场景下会产生严重的重叠问题,导致非极大值抑制过程中出现误删或漏检。同时,水平框包含大量背景区域,降低了目标定位的精确性和后续识别的可靠性。

现有检测方法在处理大尺度目标时,受限于卷积神经网络的局部感受野,难以有效捕捉长距离上下文信息。这种局部性约束使得模型对复杂场景的语义理解能力不足,制约了检测精度的进一步提升。

表1-1遥感图像目标检测面临的核心问题分析

问题类别

具体表现

产生原因

解决紧迫性

定位精度不足

旋转目标用水平框表示,交并比低

传统检测框架仅支持轴对齐框

极高

密集场景漏检

相邻目标框高度重叠,NMS误删

水平框在密集排列时重叠严重

大尺度目标感知弱

大目标上下文信息利用不充分

CNN局部感受野限制

方向信息缺失

无法获取目标的精确朝向

缺乏角度参数化建模

极高

背景

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档