基于MoCo自监督学习的海底底质声呐图像分类方法研究.pdfVIP

  • 26
  • 0
  • 约10.35万字
  • 约 83页
  • 2025-05-16 发布于广东
  • 举报

基于MoCo自监督学习的海底底质声呐图像分类方法研究.pdf

基于MoCo自监督学习的海底底质声呐图像分类方法研究

摘要

海底底质类型的判别是海底科学中极为重要的一部分,底质信息对于推动海洋科学

的发展和保护海洋环境具有重要意义。目前的声呐设备可以高效生成海底图像,将海底

信息可视化呈现,因此,基于声呐图像的海底底质分类技术成为了目前的研究热点。卷

积神经网络作为海底底质声呐图像分类中最重要的分类算法之一,在大多数情况下具有

优秀的性能。然而,卷积神经网络的卷积核大小限制了全局特征提取能力,对于声呐图

像中的全局特征分辨能力较弱。此外,海底底质声呐图像有标签数据获取难度、成本较

高,实际中声学海底底质分类一般属于小样本分类场景。针对上述问题,本论文选择全

局特征提取能力较强的SwinTransformer作为分类器,并利用MoCo自监督学习对无标

签数据进行预训练与下游任务微调,以降低训练样本过少带来的过拟合。本文详细研究

内容如下:

首先,侧扫声呐成像过程中受到自噪声、海洋环境、混响、散射等因素影响,造成

了原始侧扫声呐图像存在部分失真的情况。噪声的存在会导致图像特征不明显甚至丢失,

从而降低最终的分类准确率。为了降低图像噪声带来的影响,分别使用维纳滤波、小波

滤波和加权平均曲率滤波在数据集上进行去噪,并使用峰值信噪比、结构相似度和均方

误差作为评价指标以探究最佳去噪算法。

其次,声呐图像的全局特征是判断其底质类型的重要依据,然而目前常用的卷积神

经网络在学习图像全局特征上存在一定的瓶颈。本文首次使用SwinTransformer作为分

类器实现海底底质声呐图像分类,并分析了网络的分类性能。SwinTransformer大量使

用了注意力机制,能够有效把握图像的全局特征。具体来说,首先使用Swin-T(Tiny)、

Swin-S(Small)、Swin-B(Base)三种不同大小网络在进行了分类实验,分析了其训练

过程与分类性能并与ViT(VisionTransformer)、VGGNet(VisualGeometryGroupNetwork)、

ResNet(ResidualNetwork)、DenseNet(DenseConvolutionalNetwork)、SVM(Support

VectorMachine)、RF(RandomForest)和KNN(K-NearestNeighbor)进行了对比分析。

最后,有标签样本获取难度大、成本高,使得基于声呐图像的海底底质分类往往是

小样本场景。为了在训练样本有限的情况下提升模型的特征提取能力,本文利用了无标

签声呐图像,首次使用MoCo自监督学习对SwinTransformer的编码器进行无标签预训

练。先利用无标签声呐图像进行pretext任务预训练,使编码器学习到图像中的高级语

义,之后将其迁移至下游分类任务进行有监督学习。此外还进行了LinearEvaluation实

哈尔滨工程大学硕士学位论文

验以证明编码器有效的学习了无标签图像的特征,并将MoCo与ImageNet迁移学习进

行了对比分析,验证自监督学习相较普通迁移学习的优点。

关键词:海底底质分类;SwinTransformer;MoCo自监督学习;侧扫声呐图像

基于MoCo自监督学习的海底底质声呐图像分类方法研究

ABSTRACT

Thediscriminationofseabedsedimenttypesisanextremelyimportantpartofmarine

science,andsedimentinformationisofgreatsignificanceforpromotingthedevelopmentof

oceanographyandprotectingthemarineenvironment.Currently,sonardevicescanefficiently

generateseabedimagesandvisualizeseabedinformatio

文档评论(0)

1亿VIP精品文档

相关文档