- 0
- 0
- 约7.86万字
- 约 56页
- 2026-03-17 发布于江西
- 举报
摘要
基于深度学习的煤岩图像分类技术越来越成熟,为矿井作业实现少人化、无人化开
采做出了极大贡献。目前,基于卷积神经网络的煤岩图像分类算法趋于主流,然而,现
有方法在提取煤岩特征时存在以下缺陷:一是针对常规的2D卷积具有固定大小的卷积核
的问题,可能导致提取的图像局部特征信息不够充分。二是由于煤岩图像与自然图像的
差异性,现有的模型在两种数据上分类表现差异过大,模型泛化性较差,且矿井下的复
杂环境和资源受限的设备,模型的参数量较多,训练速度慢等问题。为了解决这些问题,
本文提出了基于深度学习的煤岩图像分类研究,具体研究内容如下所示:
针对常规卷积核导致提取图像局部特征信息不足的问题,提出了一种全新的大核并
行卷积残差网络ParaLkResNet,网络中的大核并行卷积块PLB(ParallelLargeKernel
ConvolutionBlock)被用来扩大网络的感受野,捕获图像像素间的远程依赖。与普通的二
维卷积相比,PLB除了能提取多尺度和高融合特征外,在典型的下游任务中还具有易收
敛和对不同数据的易泛化等特性。在公用自然图像数据集CIFAR10/100、CINIC-10和
COALSet-4煤岩数据集上进行了实验,所提出的方法优于当前现有模型。PLB作为一个
插件块可应用于各种计算机视觉卷积框架中,三个不同大小的并行卷积可以提取到图像
的丰富局部特征,可有效提升卷积神经网络在各种图像任务中的性能表现。
针对模型泛化性和鲁棒性较差、参数量较多、训练速度慢等问题,提出了基于轻量
化(EfficientMulti-ScaleAttention,EMA)视觉注意力的卷积残差网络DoMaResNet。在
本网络中,基于EMA视觉注意力的卷积残差块DoMaBlock用于捕获和选择关注煤岩图
像的重要局部特征信息,在保留每个通道信息的同时减少了计算开销,通过跨维交互进
一步聚合两个并行分支的输出特征,以捕获像素级成对关系,使网络在两种不同的数据
集上表现同步优异。此外,采用Do-conv方法加快网络训练时的收敛速度。使用流行的
基准(CIFAR-10/100、CINIC-10)以及COALSet-4对图像分类任务进行了广泛的对比试验以
评估其泛化性能,结果表明,本方法在保持较少的参数量的前提下,模型的训练速度和
泛化性优于现有分类模型。同样的,DoMaBlock作为一种新型的残差模块可以嵌入到任
何残差卷积神经网络中。
根据以上研究的成果以及矿下实际需求,本文设计了一种基于深度学习的煤岩图像
分类系统。该系统以上文提出的DoMaResNet为图像分类模型,能够将用户上传的图像
即时自动分类。系统右侧会显示图像所属的类别概率,直观地体现了系统的分类性能,
为煤岩图像分类的矿下应用提供了有力支持。
关键词:煤岩图像分类;卷积神经网络;ResNet;Do-conv;EMA;煤岩图像分类系统
Abstract
Thecoalandrockimageclassificationtechnologybasedondeeplearningisbecomingmore
andmorematureandhasmadegreatcontributionstotherealizationofunmannedandunmanned
mininginmineoperations.Atpresent,thecoalandrockimageclassificationalgorithmbasedon
convolutionalneuralnetworktendstobemainstream.However,theexistingmethodshavethe
followingdefectswhenextractingcoalandrockfeatures:First,theproblemoffixed-sizeconvolution
kernelsforconventional2Dconvolutionmayleadtoinsufficientlocalfeatureinformationof
原创力文档

文档评论(0)