- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
细粒度图像分类旨在对同一类别的不同子类进行识别。但相对于普通的图像分
类,细粒度图像分类具有类间差异小和类内差异大的特点,类间差异小表现为不同类
别的对象仅有细微的差异,类内差异大表现为同一类别对象呈现的姿势与角度不同。
这些原因使得细粒度分类的难度更大,如捕捉判别性区域不足,提取特征信息单一,
背景噪声冗余等问题。为了解决这些问题,本文设计了两个基于深度学习的细粒度图
像分类模型,优化网络特征提取和建模等能力,进而提高分类识别的准确率。本文完
成的工作内容如下:
1.基于Res2Net和递归门控卷积的细粒度图像分类。由于现有的细粒度图像分类
方法忽视了图像多尺度信息以及相邻空间位置信息交互作用,难以准确提取细微特
征,并且传统的CNN方法捕捉长距离语义信息不足,提取图像全局信息能力欠缺。
针对这些问题提出了一种基于Res2Net和递归门控卷积的细粒度图像分类模型,该
模型使用弱监督数据增强网络(WS-DAN)进行数据扩展防止过拟合,将Res2Net作
为特征提取网络,用以提取不同级别的尺度信息,增加网络层的感受野,同时在该网
络中引入了递归门控卷积模块,用来进一步融合信息并且实现高阶特征交互,提高网
络建模能力。该网络在多个公共数据集得到的结果表明,本方法能够有效的提取图像
细微特征,提升分类精度。
2.基于CNN-Transformer混合架构的细粒度图像分类研究。针对现有的分类算法
存在全局特征提取不足和捕获关键信息能力不足等问题,提出一种基于CNN-
Transformer混合架构的细粒度图像分类模型,该方法采用CNN和Transformer串联
结构,首先使用金字塔残差网络提取图像中不同级别的特征,随后引入反事实注意力
学习机制学习更具判别性特征,最后将特征图输入到一种改进的ViT结构以补充图
像全局特征信息,该结构融入了特征聚集和区域选择两个模块以提升ViT模型融合
层级信息和捕获关键特征的能力。设计的网络在多个公共数据集中效果较好,优于当
前许多主流模型。
关键词:深度学习;细粒度图像分类;数据增强;多尺度特征;反事实注意学习
I
Abstract
Fine-grainedimageclassificationaimsatidentifyingdifferentsubcategoriesofthe
samecategory.However,comparedwithordinaryimageclassification,fine-grainedimage
classificationhasthecharacteristicsofsmallinter-classdifferencesandlargeintra-class
differences.Smallinter-classdifferencesaremanifestedinobjectsofdifferentcategories
withonlyslightdifferences,thelargeintra-classdifferenceismainlymanifestedinthe
differentpostureandAngleofthesameclassobject.Thesereasonsmakefine-grained
classificationmoredifficult,suchasinsufficientcaptureofdiscriminativeareas,single
featureinformationextracted,andredundantbackgroundnoise.Inordertosolvethese
problems,thisarticledesignedtwofine-grainedimageclassificationmodelsbasedondeep
learningtooptimi
您可能关注的文档
- 变译理论指导下American+Government+(节选)的译后编辑策略.pdf
- 城市群视角下城镇化对城市碳排放的影响研究.pdf
- 初一学生核心自我评价对主观幸福感的影响机制及干预研究.pdf
- 国有企业ZL的技术员工绩效管理研究.pdf
- 含C=C和C=O键不饱和化合物加氢脱氧反应机理的密度泛函理论研究.pdf
- 基于15分钟健身圈下太原市城区健身公园的体育资源配置和空间分布特征.pdf
- 基于DEM的非线性随机系统参数估计.pdf
- 基于LoRa技术的空气呼吸器状态监测系统设计与研究.pdf
- 基于SEM+fsQCA的数字平台互补者持续采用意向研究——以Android操作系统为例.pdf
- 基于定制极化KTP晶体的皮秒脉冲激光双穿倍频研究.pdf
- 2025年大理护理职业学院单招职业技能测试题库附答案.docx
- 2025年商丘职业技术学院单招职业倾向性考试题库审定版.docx
- 2025年滁州职业技术学院单招职业倾向性测试题库审定版.docx
- 2025年浙江纺织服装职业技术学院单招职业适应性测试题库完整.docx
- 2025年滨州科技职业学院单招职业适应性考试题库审定版.docx
- 2025年河北能源职业技术学院单招综合素质考试题库最新.docx
- 2025年新疆科技职业技术学院单招职业适应性考试题库参考答案.docx
- 2025年无锡商业职业技术学院单招职业适应性测试题库附答案.docx
- 2025年广东碧桂园职业学院单招职业技能测试题库及答案一套.docx
- 2025年江苏省苏州市单招职业适应性测试题库学生专用.docx
文档评论(0)