- 3
- 0
- 约9.38千字
- 约 17页
- 2026-03-14 发布于湖北
- 举报
基于数据增强的番茄病害分类方法实验探究报告
1.1引言
最简单直接的方法就是进行数据增强,借由数据增强方法来产生新的番茄病害样本,加入到番茄病害样本数量较少的类属中,这样就会使得番茄病害数据集类属间样本数量更均衡。因此,本章将对原始数据集进行离线数据增强,扩充其中数量较少的类属样本,降低其因类属间样本数量不均衡带来的负面影响,提升模型的性能,经由VGG16、InceptionV3、ResNet50、MobileNetV2这四种卷积神经网络的训练和测试,通过对比相关的评估指标来验证数据增强的有效性。
1.2数据增强思想
计算机视觉中的图像增强,是人为的为视觉不变性(语义不变)引入了先验知识。数据增强也基本上成了提高模型性能的最简单、直接的方法了。
首先增强的样本和原来的样本是由强相关性的(裁剪、翻转、旋转、缩放、扭曲等几何变换)。即我们强制网络学习了某些样本变换方式,而如果这些变换方式使得网络的性能有所提升,那么,可以简单的认为网络在之前并没有学到相关的变换,或者学的并不全面。而如果通过某些简单的操作,提高了最终性能,这说明网络可能并没有我们想象的那种方式去拟合数据,比如简单的平移不变性。即,如果我们通过简单的裁剪、平移提高了模型的性能,那么,恰恰说明网络可能并没有完全学习到平移不变性。
再者,在一些对抗样本的研究中,CNN对图像中某些稍微的扰动,就可能导致致命的分类错误,这在某种程度上说明了CNN其实是非常敏感的,更别提各种变换了。CNN目前来说对平移不变性支持的最好,也就是CNN的分类结果和样本中的目标物体位置无关。这是假设CNN学习了很好的形状(全局)特征,而一些研究表明,CNN其实只学习了某些图像的纹理特征,如果一张图像中包含了足够多的纹理特征的话,其实CNN就不去管形状了,这在某些方面,也可以说是某种平移不变性,而对于真正的包含目标物体的形状的平移不变性,还有待考量。如果CNN真的具有平移不变性(目标位置无关性),或许,CNN就能捕捉某些长距依赖性,而其实CNN的长距依赖性目前对具体任务来说还不够好,但从分类任务来说或许够了。或许可以说,CNN具有某种程度的平移不变性。
我们在训练过程中保证一定的几率使用原始数据,这样保证了原数据集是增强后集合的子集,只要训练轮数充足,网络无非是多学了某些样本,这对网络来说并非坏事。难学习的样本(hardsample)对分类决策面的决定十分重要,如果将这些样本通过数据增强发掘出来,或许对泛化能力很有帮助。严格来说,增强后的样本和原来的样本有很强的关系。我们希望增强后的数据集是原来整体样本分布的子分布,至少它们的交集中包含原来的数据集,从这方面讲,我们或许稍微扩展了原数据集的样本分布空间,使得网络捕捉到了一些额外的信息。我们把增强后的数据集包含原有数据集的假设称为增强保证性假设,也就是在增强保证性假设下训练的网络一定能够提高泛化能力。
1.3数据增强的分类
数据增强可以分为离线增强和在线增强。
(1)离线增强:对原始图像数据集进行处理,将增强后的图像数据集扩充到原始数据集中。
(2)在线增强:当数据集样本较大时,模型在训练过程中对每个batch的样本进行扩充,其在GPU内部运行,并不扩充到原始数据集中。
由于本文数据集样本数量不大,且为了能够使得不同类属样本数目呈现出可视化的状态,便于更好的控制和把握参与训练的数据集。本文在后续工作中将采用离线数据增强的方式。
1.4数据增强方法
本章以数据集的某张番茄病害图像为例,探讨不同的数据增强方式带来的影响。原始图像如图4-1所示。
图4-1原始图像(800,533,3)
1.1.1缩放
对图像进行缩放操作。图像缩小其实就是对原有的多个数据进行抽取,获得期望缩小尺寸的数据,并且尽量保持原有特征;图像放大正好相反,若是放大倍数为,其是将原有图像每个像素值填充到新图像中的的子块中,其公式如4-1所示。
MACROBUTTONMTEditEquationSection2SEQMTEqn\r\hSEQMTSec\r1\hSEQMTChap\h
图4-2是本次实验某张病害图像缩放0.2倍后的例子。
(a)resize后的图像(160,107,3)(b)rescale后的图像(160,107,3)
图4-2缩放0.2倍后的图像(分别对应resize和rescale)
这里采用两种不同的缩放方式,一种是方式,当对番茄叶片病害图像进行压缩时,选择算法实现效果较好,当对番茄叶片病害图像放大时,通常选择,但是速度较慢,或速度更快,效果也还不错。
rescale参数只能按照一定比例进行缩放,实际中我们会有大量的样本,并且尺寸大小不一,需要缩放到指定大小,rescale启用抗锯齿,以免产生锯齿失真,指在缩
您可能关注的文档
- 2026《虚拟现实技术在高中物理教学中的应用问卷调查研究(附问卷)》8400字.docx
- 2026《深度学习算法在推荐系统中的应用分析》8600字.docx
- 2026《一款汽车的前悬架结构设计》9500字.doc
- 2026《运输车驱动主减速器结构设计计算》8100字.docx
- 2026《某厢式运输车驱动主减速器结构计算设计与校核》8300字.docx
- 2026《BIM技术在建设工程进度管理中的应用研究》11000字.docx
- 2026《基于Android系统的校园体育资讯系统设计》11000字.docx
- 2026《中轧线材轧机设计》13000字.doc
- 2026《金尾矿混凝土抗冻性能研究报告》3800字.docx
- 2026《点目标识别电路系统的软件设计及电路调试分析案例》7000字.docx
最近下载
- 竞争法学(第四版)课件全套(王先林)第1--11讲 竞争与竞争法的若干基本问题---中国反不正当竞争法的基本制度(四).ppt
- 小学数学课程标准与教材深度解析.pptx VIP
- 《GB18587-2016 室内装饰装修材料 地毯、地毯衬垫.》.pdf VIP
- 国防动员(讲稿).doc VIP
- 岗位人才画像(经理层).xlsx VIP
- 智能垃圾分类系统外文文献翻译中英文最新 (2).doc VIP
- 2026年山西工程职业学院单招语文测试题库.docx VIP
- DB22_T 5092-2015 城镇道路养护技术规程.docx VIP
- 2022年新高考全国一卷数学解析.pdf VIP
- 2025年重庆春招考试题型及答案.doc VIP
原创力文档

文档评论(0)