基于MoCo自监督学习的海底底质声呐图像分类方法研究.pdfVIP

下载本文档

26
0
约10.35万字
约 83页
2025-05-16 发布于广东
举报

基于MoCo自监督学习的海底底质声呐图像分类方法研究.pdf

基于MoCo自监督学习的海底底质声呐图像分类方法研究

摘要

海底底质类型的判别是海底科学中极为重要的一部分，底质信息对于推动海洋科学

的发展和保护海洋环境具有重要意义。目前的声呐设备可以高效生成海底图像，将海底

信息可视化呈现，因此，基于声呐图像的海底底质分类技术成为了目前的研究热点。卷

积神经网络作为海底底质声呐图像分类中最重要的分类算法之一，在大多数情况下具有

优秀的性能。然而，卷积神经网络的卷积核大小限制了全局特征提取能力，对于声呐图

像中的全局特征分辨能力较弱。此外，海底底质声呐图像有标签数据获取难度、成本较

高，实际中声学海底底质分类一般属于小样本分类场景。针对上述问题，本论文选择全

局特征提取能力较强的SwinTransformer作为分类器，并利用MoCo自监督学习对无标

签数据进行预训练与下游任务微调，以降低训练样本过少带来的过拟合。本文详细研究

内容如下：

首先，侧扫声呐成像过程中受到自噪声、海洋环境、混响、散射等因素影响，造成

了原始侧扫声呐图像存在部分失真的情况。噪声的存在会导致图像特征不明显甚至丢失，

从而降低最终的分类准确率。为了降低图像噪声带来的影响，分别使用维纳滤波、小波

滤波和加权平均曲率滤波在数据集上进行去噪，并使用峰值信噪比、结构相似度和均方

误差作为评价指标以探究最佳去噪算法。

其次，声呐图像的全局特征是判断其底质类型的重要依据，然而目前常用的卷积神

经网络在学习图像全局特征上存在一定的瓶颈。本文首次使用SwinTransformer作为分

类器实现海底底质声呐图像分类，并分析了网络的分类性能。SwinTransformer大量使

用了注意力机制，能够有效把握图像的全局特征。具体来说，首先使用Swin-T（Tiny）、

Swin-S（Small）、Swin-B（Base）三种不同大小网络在进行了分类实验，分析了其训练

过程与分类性能并与ViT（VisionTransformer）、VGGNet（VisualGeometryGroupNetwork）、

ResNet（ResidualNetwork）、DenseNet（DenseConvolutionalNetwork）、SVM（Support

VectorMachine）、RF（RandomForest）和KNN（K-NearestNeighbor）进行了对比分析。

最后，有标签样本获取难度大、成本高，使得基于声呐图像的海底底质分类往往是

小样本场景。为了在训练样本有限的情况下提升模型的特征提取能力，本文利用了无标

签声呐图像，首次使用MoCo自监督学习对SwinTransformer的编码器进行无标签预训

练。先利用无标签声呐图像进行pretext任务预训练，使编码器学习到图像中的高级语

义，之后将其迁移至下游分类任务进行有监督学习。此外还进行了LinearEvaluation实

哈尔滨工程大学硕士学位论文

验以证明编码器有效的学习了无标签图像的特征，并将MoCo与ImageNet迁移学习进

行了对比分析，验证自监督学习相较普通迁移学习的优点。

关键词：海底底质分类；SwinTransformer；MoCo自监督学习；侧扫声呐图像

基于MoCo自监督学习的海底底质声呐图像分类方法研究

ABSTRACT

Thediscriminationofseabedsedimenttypesisanextremelyimportantpartofmarine

science,andsedimentinformationisofgreatsignificanceforpromotingthedevelopmentof

oceanographyandprotectingthemarineenvironment.Currently,sonardevicescanefficiently

基于MoCo自监督学习的海底底质声呐图像分类方法研究.pdfVIP

基于MoCo自监督学习的海底底质声呐图像分类方法研究.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档