2026《基于数据增强的番茄病害分类方法实验探究报告》5600字.docxVIP

  • 3
  • 0
  • 约9.38千字
  • 约 17页
  • 2026-03-14 发布于湖北
  • 举报

2026《基于数据增强的番茄病害分类方法实验探究报告》5600字.docx

基于数据增强的番茄病害分类方法实验探究报告

1.1引言

最简单直接的方法就是进行数据增强,借由数据增强方法来产生新的番茄病害样本,加入到番茄病害样本数量较少的类属中,这样就会使得番茄病害数据集类属间样本数量更均衡。因此,本章将对原始数据集进行离线数据增强,扩充其中数量较少的类属样本,降低其因类属间样本数量不均衡带来的负面影响,提升模型的性能,经由VGG16、InceptionV3、ResNet50、MobileNetV2这四种卷积神经网络的训练和测试,通过对比相关的评估指标来验证数据增强的有效性。

1.2数据增强思想

计算机视觉中的图像增强,是人为的为视觉不变性(语义不变)引入了先验知识。数据增强也基本上成了提高模型性能的最简单、直接的方法了。

首先增强的样本和原来的样本是由强相关性的(裁剪、翻转、旋转、缩放、扭曲等几何变换)。即我们强制网络学习了某些样本变换方式,而如果这些变换方式使得网络的性能有所提升,那么,可以简单的认为网络在之前并没有学到相关的变换,或者学的并不全面。而如果通过某些简单的操作,提高了最终性能,这说明网络可能并没有我们想象的那种方式去拟合数据,比如简单的平移不变性。即,如果我们通过简单的裁剪、平移提高了模型的性能,那么,恰恰说明网络可能并没有完全学习到平移不变性。

再者,在一些对抗样本的研究中,CNN对图像中某些稍微的扰动,就可能导致致命的分类错误,这在某种程度上说明了CNN其实是非常敏感的,更别提各种变换了。CNN目前来说对平移不变性支持的最好,也就是CNN的分类结果和样本中的目标物体位置无关。这是假设CNN学习了很好的形状(全局)特征,而一些研究表明,CNN其实只学习了某些图像的纹理特征,如果一张图像中包含了足够多的纹理特征的话,其实CNN就不去管形状了,这在某些方面,也可以说是某种平移不变性,而对于真正的包含目标物体的形状的平移不变性,还有待考量。如果CNN真的具有平移不变性(目标位置无关性),或许,CNN就能捕捉某些长距依赖性,而其实CNN的长距依赖性目前对具体任务来说还不够好,但从分类任务来说或许够了。或许可以说,CNN具有某种程度的平移不变性。

我们在训练过程中保证一定的几率使用原始数据,这样保证了原数据集是增强后集合的子集,只要训练轮数充足,网络无非是多学了某些样本,这对网络来说并非坏事。难学习的样本(hardsample)对分类决策面的决定十分重要,如果将这些样本通过数据增强发掘出来,或许对泛化能力很有帮助。严格来说,增强后的样本和原来的样本有很强的关系。我们希望增强后的数据集是原来整体样本分布的子分布,至少它们的交集中包含原来的数据集,从这方面讲,我们或许稍微扩展了原数据集的样本分布空间,使得网络捕捉到了一些额外的信息。我们把增强后的数据集包含原有数据集的假设称为增强保证性假设,也就是在增强保证性假设下训练的网络一定能够提高泛化能力。

1.3数据增强的分类

数据增强可以分为离线增强和在线增强。

(1)离线增强:对原始图像数据集进行处理,将增强后的图像数据集扩充到原始数据集中。

(2)在线增强:当数据集样本较大时,模型在训练过程中对每个batch的样本进行扩充,其在GPU内部运行,并不扩充到原始数据集中。

由于本文数据集样本数量不大,且为了能够使得不同类属样本数目呈现出可视化的状态,便于更好的控制和把握参与训练的数据集。本文在后续工作中将采用离线数据增强的方式。

1.4数据增强方法

本章以数据集的某张番茄病害图像为例,探讨不同的数据增强方式带来的影响。原始图像如图4-1所示。

图4-1原始图像(800,533,3)

1.1.1缩放

对图像进行缩放操作。图像缩小其实就是对原有的多个数据进行抽取,获得期望缩小尺寸的数据,并且尽量保持原有特征;图像放大正好相反,若是放大倍数为,其是将原有图像每个像素值填充到新图像中的的子块中,其公式如4-1所示。

MACROBUTTONMTEditEquationSection2SEQMTEqn\r\hSEQMTSec\r1\hSEQMTChap\h

图4-2是本次实验某张病害图像缩放0.2倍后的例子。

(a)resize后的图像(160,107,3)(b)rescale后的图像(160,107,3)

图4-2缩放0.2倍后的图像(分别对应resize和rescale)

这里采用两种不同的缩放方式,一种是方式,当对番茄叶片病害图像进行压缩时,选择算法实现效果较好,当对番茄叶片病害图像放大时,通常选择,但是速度较慢,或速度更快,效果也还不错。

rescale参数只能按照一定比例进行缩放,实际中我们会有大量的样本,并且尺寸大小不一,需要缩放到指定大小,rescale启用抗锯齿,以免产生锯齿失真,指在缩

文档评论(0)

1亿VIP精品文档

相关文档