基于改进模型剪枝的下茧实时检测模型.docxVIP

下载本文档

0
0
约5.71千字
约 6页
2023-07-29 发布于广东
举报
版权申诉

基于改进模型剪枝的下茧实时检测模型.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于改进模型剪枝的下茧实时检测模型中国是中国的发源地，已有5000多年的历史。“一带一路”战略构想的提出，为我国蚕桑业发展提供了良好的契机，可以促进行业的转型与发展，对于提高我国蚕桑业在国际市场上的竞争力具有极大的战略意义国外对于蚕茧检测的研究较少，Musayev 国内外利用传统的数字图像处理和光电技术，通过图像采集和处理分析推算出蚕茧干壳质量、蚕茧茧层质量、茧壳表面积，可进行蚕茧定位、蚕茧数量统计计算、黄斑茧剔除，具有一定参考价值，但这些检测方法实时性较差，且较为繁琐复杂，实施难度大，对象仅限于上车茧、下茧中的单个类别，不能将下茧全部检测出来以便分拣剔除，缺乏实用性。基于以上分析，本文通过构建下茧检测数据集，对YOLOv3模型进行锚点框参数重新选取、模型参数压缩、嵌入感受野模块(RFB)改进，提出下茧实时检测模型。因该模型的主要工作是进行模型压缩(MC)和嵌入感受野模块，故定义为YOLOv3-MC-RFB。 1 yolov3模型 YOLOv3模型是YOLO 2 yolov3-mc-rb模型 2.1 聚类分析的前提 YOLOv3模型候选锚点框参数是通过对COCO数据集进行聚类分析确定的。该数据集类别较多，锚点框尺寸之间差距较大，锚点框形状既有长方形也有正方形。对下茧检测数据集锚点框高宽比进行可视化分析，结果如图2所示。可以看出，锚点框的高宽比主要在0.75～1.25区间内，表明下茧检测数据集的锚点框尺寸相对于COCO数据集的目标，锚点框较单一，宽高比变化比较小，锚点框形状接近正方形;故YOLOv3模型候选锚点框参数并不适用于下茧检测，因此，在训练模型前需要先进行K-means聚类分析，选择适合本文数据集的锚点框参数。 K-means聚类分析的思想是:以空间中K个点为中心进行聚类，对靠近他们的对象进行归类。通过迭代的方法逐次更新聚类中心的值，直到得到最好的聚类结果。选择416像素×416像素作为输入图像尺寸，对下茧检测数据集的552幅图像进行K-means聚类分析。因为YOLOv3模型有3个YOLO层进行3个尺度的预测，且每个YOLO层都有相同数量的锚点框负责对目标进行预测，所以锚点框数量逐次取值3、6、9和12，通过对比不同数量锚点框的模型平均精度均值(m AP)，选择适合本文下茧检测数据集的锚点框数量。 2.2 yolov3模型卷积神经网络具有优越的性能，可对数百万的参数进行训练，所以巨大的参数量会使网络模型非常大。本文使用的YOLOv3模型大小为240.00 M左右，在嵌入式设备上对其有限的运算能力和储存空间来说是一个巨大的挑战。Liu等 BN层具有加快网络的训练速度和收敛速度，控制梯度爆炸，防止梯度消失以及防止过拟合的作用，因此，被广泛用于卷积层和线性层后对特征图进行归一化处理。在YOLOv3模型中BN层的计算过程如下。步骤1:计算BN层前卷积层的卷积结果。式中:x 步骤2:计算BN层输出结果。式中:γ和β为需要训练的参数;γ为BN层的gamma系数;β为BN层的beta项;μ为x 将式(1)代入式(2)得到式(3)，即为BN层的计算公式。从BN层的计算公式可以看出，在每个通道上都有1个缩放因子γ与之对应，因此，可以根据稀疏化训练时得到每个通道的缩放因子γ来判断该通道对于网络的重要程度。γ越接近于1说明该通道越重要，故可以将γ接近于0的通道进行剪枝来实现模型压缩。模型通道剪枝示意图步骤1:用下茧检测数据集训练YOLOv3模型，得到基础模型; 步骤2:对基础模型进行稀疏化训练，使得特征图经过BN层后对于下茧预测贡献程度较低的通道对应的缩放因子γ尽量趋近于0; 步骤3:确定剪枝比例，将低于剪枝比例设定阈值的缩放因子对应的通道删除; 步骤4:对剪枝后的模型进行精度微调，减小精度损失; 步骤5:生成新的下茧检测模型文件。 2.3 洞穴卷积感受野的计算 Liu等在卷积神经网络中，感受野指的是卷积神经网络每层输出的特征图上的像素点在原始图像上映射的区域大小。感受野尺寸的求解相当于已知输出特征图反向求出输入特征图的过程。计算感受野大小时，常采用自顶向底的方式计算，即先计算最终特征图在前一层上的感受野，然后逐渐传递到第1层。当卷积为普通卷积时，假设不考虑补零操作，感受野计算公式如下: 式中:l 当s=1时，式(4)可以简化为当卷积为空洞卷积时，卷积核尺寸的计算公式为式中:N为空洞卷积的卷积核尺寸;n为普通卷积的卷积核尺寸;r为空洞卷积的扩张率。空洞卷积计算感受野时，假设不考虑补零操作，只需将普通卷积感受野计算时的卷积核尺寸替换成空洞卷积的卷积核尺寸即可，空洞卷积感受野计算公式为将式(6)代入式(7)得到: 当s=1，式(8)可化简为在RFB模块中共有3层卷积计算，所有卷积的步长都为1，其中2层是普通卷积