- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于零样本学习的目标分类方法研究
摘要
在计算机视觉领域,图像分类一贯被认为是一个富有挑战性和重要性的任务。随
着人工智能技术的迅猛发展,图像分类技术已经在多个领域展现出了广泛的应用前景。
然而,传统的监督学习方法在某些情况下也存在局限性,在现实世界中,获取大规模
标记数据集是一项昂贵和耗时的任务,而且有时甚至是不可行的。因此,面对数据稀
缺或新类别出现的情况,传统监督学习方法已经不再适用,基于零样本学习的图像分
类技术应运而生。传统的监督学习方法往往都需要大量已经被标记的数据来训练模型,
然后才能对新的数据进行分类,而零样本学习不需要已经被标记的数据来训练样本,
而是通过利用类别的语义描述或属性信息,使模型能够对以前未见过的类别进行分类。
这在很大程度上扩展了图像分类技术的应用范围,提高了模型对未知类别的泛化能力,
并且减少了对大量标记数据的依赖。本文针对基于零样本学习的目标分类方法展开研
究,主要研究内容如下:
首先,了解了零样本学习问题定义和评价指标等理论基础,对现有零样本学习研
究方法进行了解并分类总结,并通过在几个基准数据集上进行对比试验,分析了现有
方法的优势和劣势,为后续研究打下理论基础
其次,对基于嵌入的零样本学习分类方法展开研究。现有方法虽然引入注意力机
制,但这些方法通常希望能够从单幅图像中学习到有价值的信息,而忽略了属性的局
部信息以及视觉特征的可转移性。为了解决现有方法在属性特征和语义信息相互映射
过程中,由于全局特征干扰,无法发挥出局部属性更大作用的问题,针对该问题,本
文提出了一种基于Transformer的零样本学习分类方法。该方法采用自适应网格化和局
部属性定位,在属性视觉特征与语义特征向量之间建立更加准确的映射关系对网络进
行优化。通过一系列对比和消融实验验证了改进后算法在分类性能上得到了提升。
再次,对基于伪样本生成的零样本学习方法进行研究。考虑到图像的采集方式和
使用场景的不同,一些特殊场景的图像数据量稀疏、标注难度大等特点,上文中方法
对特殊场景下的图像不再适用。针对此类问题,通过生成伪样本,对数据集进行扩充,
将问题转化为监督学习问题。本文选择声呐图像作为研究对象,由于声呐图像具有图
像噪声大、目标模糊、细节特征缺失的特点,本文提出一种基于改进CycleGAN的零样
本学习分类方法。在生成器网络中引入注意力机制等对网络进行优化,用于指导生成
哈尔滨工程大学硕士学位论文
图像的特征,从而使生成得伪样本的质量得到提高,并使最终分类结果性能得到提升。
通过一系列实验表明该方法在零样本声呐图像分类上得到了理想的效果。
最后,对基于大模型微调的零样本学习方法进行研究。现有基于嵌入的方法和基
于生成的方法基本都要求训练集和测试集属于同一领域,这使得这些方法和训练所得
的模型都只能针对特定的领域和数据范围的问题进行分类,所以研究能够适用于跨领
域的通用方法是非常有必要的。本文提出了一种基于大模型ContrastiveLanguage-Image
Pre-Training,简称CLIP进行微调的零样本学习分类方法,通过引入缓存空间网络使用
少量特定领域数据对模型最终结果进行微调,使模型满足解决通用问题的同时,可以
按着需求针对某一特定领域进行微调,进一步提升的模型的应用价值,并通过实验验
证了该方法的有效性。
关键词:图像分类;零样本学习;Transformer;CycleGAN;CLIP
基于零样本学习的目标分类方法研究
ABSTRACT
Intherealmofcomputervision,imageclassificationremainsaformidableandpivotal
challenge.Asartificialintelligenceanddeeplearningcontinuetoadvanceatarapidpace,the
applicationofimageclassificationtechnologyhasproliferatedacrossdiversedomains,
您可能关注的文档
最近下载
- 02S701 砖砌化粪池建筑工程图集 .docx VIP
- 旅游度假区目标客户群分析.docx VIP
- TCBDA 27-2019 建筑装饰装修机电末端综合布置技术规程.pdf VIP
- 《飞机构造基础》课件——第九章 飞机防火系统.pptx VIP
- 中信泰富:2008年年度报告.pdf
- 《飞机构造基础》课件——第二章 重量与平衡.pptx VIP
- 医院绩效考核分配方案及实施细则.pdf VIP
- 旅游市场的目标客户群分析与定位.docx VIP
- D-Z-T 0204-2022 矿产地质勘查规范 稀土(正式版).docx VIP
- 2025初中七年级数学下册《相交线与平行线》大单元整体教学设计.docx
文档评论(0)