网站大量收购独家精品文档,联系QQ:2885784924

基于未标记数据有效利用的开放集识别方法.pdf

基于未标记数据有效利用的开放集识别方法.pdf

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

摘要

开放集识别的主要目的是识别未标记数据中的新类样本,同时对已见类样本进

行正确分类。在开放集识别任务中,训练样本和测试样本的类别空间不同,测试样

本可以来自任何未知类别。作为机器学习领域中的一个重要研究方向,开放集识别

不仅对发现新类有重要的科学研究意义,而且在安全领域、自动驾驶、图像识别等

领域发挥着重要的应用价值。目前在开放集识别的相关研究中,基于阈值、基于概

率模型以及基于深度学习等方法都已经取得了一系列重要研究成果。然而,目前的

方法对未标记数据的利用不足,导致模型的性能提升受限。未标记数据中往往包含

重要的信息,例如数据的分布和特征表示。为此,本文充分利用未标记数据来展开

开放集识别研究。主要成果如下:

1

()针对开放集识别中未标记数据评估和伪标记信息利用不足问题,提出了基

于主动学习的开放集识别模型。在图像数据中展开实验,该模型充分利用未标记数

据提升开放集识别性能。引入已见类别的语义知识,构建语义知识和图像特征的映

射关系。利用阈值选择策略区分未标记数据中的开放集样本和已见类样本,通过主

动学习模型迭代地识别高置信度开放集样本和已见类样本,并将高置信度的已见类

样本添加到标记数据集中,减少开放集样本对分类模型的影响并扩充标记数据集。

在相关图像分类数据集的实验结果表明了该方法的有效性。

2

()针对开放集识别中通过单一准则对未标记数据进行识别,导致开放集样本

识别准确率欠佳的问题,提出一种基于PU学习的开放集识别模型。首先,利用PU

学习对未标记样本进行初步分类。然后,使用编码器提取特征表示,经过解码器重

构样本特征,根据重构的特征误差再次对未标记样本进行分类;最终,将两次分类

结果一致的样本被认为是高置信度的已见类样本或者开放集样本,分类结果不一致

的样本再次通过加权重新分配的方法进行调整。在相关数据集上进行了实验,实验

结果表明了提出方法的有效性。

综上所述,本文针对开放集识别中对未标记数据利用不足带来的问题,提出了

相应的有效利用未标记数据的开放集识别模型,为开放集识别提供了新思路。研究

成果对开放集识别领域有重要作用,可广泛应用于开放环境下的图像分类、人脸识

别等任务。

I

关键词:开放集识别;主动学习;PU学习;图像识别

II

ABSTRACT

Themainobjectiveofopensetrecognitionistoidentifynewclasssamplesin

unlabeleddatawhilecorrectlyclassifyingthesamplesofknownclasses.Inopenset

recognitiontasks,thecategoryspacesoftrainingsamplesandtestsamplesaredifferent,

andtestsamplescancomefromanyunknowncategory.Asanimportantresearch

directioninthefieldofmachinelearning,opensetrecognitionnotonlyhassignificant

scientificresearchsignificancefordiscoveringnewclasses,butalsoplaysanimportant

roleinpracticalapplicationssuchassecurity,autonomousdriving,andimagerecognition.

Currently,intherelatedresearchonopensetrecognition,methodsbasedonthresholds,

probabilisticmodels,anddeeplearninghaveallachievedaseriesofimportantresearch

results

您可能关注的文档

文档评论(0)

dongbuzhihui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档