- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中文摘要
随着深度学习的迅速发展,神经网络算法在图像数据特征提取领域备受关
注,卷积神经网络无需依赖繁琐的人工特征工程,可直接应用于各种视觉识别
任务。然而,在实际应用场景中,图像数据样本稀少和低分辨率等特点对特征
提取带来了极大的挑战。因此,如何在图像数据量少的基础上抽取到高质量的
特征信息成为研究热点之一。
传统的卷积神经网络因其卷积结构只关注图像数据的相邻特征信息,忽视
了全局信息的重要性,导致其无法在有限的图像数据中提取到高质量特征信
息,而自注意力机制模型具有优秀的全局信息提取能力,能够有效捕捉图像中
的整体结构和关系。因此,为解决传统卷积神经网络无法捕获图像全局信息的
问题并进一步提取到高质量的特征信息,本文以ConvNeXt为骨干网络,结合
自注意力机制,对抽取的特征信息进行分类问题的研究,本文主要工作如下:
(1)提出了基于ConvNeXt的全局信息双向维度聚合算法。该算法是一种
CNN与LSTM结合的模型,在增强局部感受野的前提下更好地融合图像数据的
全局信息,此算法以主干网络ConvNext-T为基础模型,通过拼接不同大小卷积
核以融合多尺度视觉特征,并从水平和垂直两个方向聚合双向长短期记忆网络
关注全局与局部信息的交互性,从而获得更好的视觉语义特征和分类准确性。
(2)提出了基于ConvNeXt的自注意力机制自适应性提示算法。该算法为
充分利用预训练模型的先验知识,引入预训练权重并在输入空间中添加特定任
务的自注意力机制提示块,将其作为额外信息输入到模型中进行训练。随后,
在增强通道间的竞争条件下,以极小的参数量进行预训练模型的自适应性调
整。最终,实现将视觉领域中通用的特征信息应用于特定的视觉任务,以获取
更具针对性的语义特征。
本文在TinyImageNet、CIFAR等数据集上对提出的两种算法进行实验验
证,结果表明,算法一相较于基础模型ConvNeXt-T在三类数据集准确率上提
高了3.18%、2.91%、1.03%,算法二相比其他微调方法在CNN和Transformer
架构模型的平均准确率上分别提高了0.55%和1.86%。
关键词:ConvNeXt;特征提取;双向维度聚合;自注意力机制提示块
I
ABSTRACT
Withtherapiddevelopmentofdeeplearning,neuralnetworkalgorithmshave
attractedmuchattentioninthefieldofimagedatafeatureextraction,and
convolutionalneuralnetworkscanbedirectlyappliedtoavarietyofvisual
recognitiontaskswithoutrelyingontediousmanualfeatureengineering.However,in
practicalapplicationscenarios,featuressuchassparseimagedatasamplesandlow
resolutionposegreatchallengestofeatureextraction.Therefore,howtoextracthigh-
qualityfeatureinformationbasedonthesmallamountofimagedatahasbecomeone
oftheresearchhotspots.
Thetraditionalconvolutionalneuralnetworkonlyfocuses
您可能关注的文档
- 混合式教学法在中职旅游专业课教学中的应用研究.pdf
- 活动星系核的伽玛射线辐射和伽玛射线耀发统计性质研究.pdf
- 活化过硫酸钠氧化对土壤不同团聚体中PAHs去除效果研究.pdf
- 活性表达可调制的铁基纳米酶的开发及生物医学应用.pdf
- 活性炭负载Fe3O4的制备及其处理乳液废水性能研究.pdf
- 积极老龄化视角下老年人就业权的法治保障.pdf
- 积极心理健康课程提升高中生心盛的效果研究.pdf
- 基层部门预算管理一体化优化研究—以Y税务分局为例.pdf
- 基层税务机关纳税服务优化研究——以G市税务局为例.pdf
- 基层税务机关纳税服务优化研究—以H市(县级市)税务局为例.pdf
- 临期食品动态定价系统行业相关公司筹备报告.docx
- 微型植物工厂订阅行业可行性分析报告.docx
- 塑料降解工程菌开发行业可行性分析报告.docx
- 河南省南阳市卧龙区2024-2025学年八年级下学期3月两校联考数学试题[含答案].pdf
- 车规级激光雷达芯片行业可行性分析报告.docx
- 河南省三门峡市第一次月考2024-2025学年八年级下学期3月月考数学试题[含答案].pdf
- 河南省三门峡市第一次月考2024-2025学年七年级下学期3月月考数学试题[含答案].pdf
- 河南省三门峡市外国语中学2024-2025学年下学期八年级数学第一次月考试卷[含答案].pdf
- 智慧公园生态监测行业可行性分析报告.docx
- 国开一网一 建筑信息模型(BIM)测试1答案.docx
最近下载
- 通信工程师中级考试传输与接入无线务实真题及答案近年合集.pdf VIP
- 2025年郑州铁路职业技术学院单招职业适应性测试题库完美版.docx
- 土方工程施工质量控制要点.ppt
- Wi-Fi技术及应用.ppt VIP
- 学习教育专题党课:严守中央八项规定精神,争做新时代合格党员.docx VIP
- 2025年党支部书记学习教育专题党课中央八项规定专题党课讲稿(严守中央八项规定精神,争做新时代合格党员;从中央八项规定精神看党员干部的责任与担当).docx VIP
- 9.1.2 用坐标描述简单几何图形(教学设计)七年级数学下册(人教版2025).pdf
- 2025年通信工程师中级传输与接入(无线)真题及答案解析 .pdf VIP
- 研究生考试政治常考知识点.pdf VIP
- 基于单片机的智能家居语音识别控制系统.docx
文档评论(0)