- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
开放集识别的主要目的是识别未标记数据中的新类样本,同时对已见类样本进
行正确分类。在开放集识别任务中,训练样本和测试样本的类别空间不同,测试样
本可以来自任何未知类别。作为机器学习领域中的一个重要研究方向,开放集识别
不仅对发现新类有重要的科学研究意义,而且在安全领域、自动驾驶、图像识别等
领域发挥着重要的应用价值。目前在开放集识别的相关研究中,基于阈值、基于概
率模型以及基于深度学习等方法都已经取得了一系列重要研究成果。然而,目前的
方法对未标记数据的利用不足,导致模型的性能提升受限。未标记数据中往往包含
重要的信息,例如数据的分布和特征表示。为此,本文充分利用未标记数据来展开
开放集识别研究。主要成果如下:
1
()针对开放集识别中未标记数据评估和伪标记信息利用不足问题,提出了基
于主动学习的开放集识别模型。在图像数据中展开实验,该模型充分利用未标记数
据提升开放集识别性能。引入已见类别的语义知识,构建语义知识和图像特征的映
射关系。利用阈值选择策略区分未标记数据中的开放集样本和已见类样本,通过主
动学习模型迭代地识别高置信度开放集样本和已见类样本,并将高置信度的已见类
样本添加到标记数据集中,减少开放集样本对分类模型的影响并扩充标记数据集。
在相关图像分类数据集的实验结果表明了该方法的有效性。
2
()针对开放集识别中通过单一准则对未标记数据进行识别,导致开放集样本
识别准确率欠佳的问题,提出一种基于PU学习的开放集识别模型。首先,利用PU
学习对未标记样本进行初步分类。然后,使用编码器提取特征表示,经过解码器重
构样本特征,根据重构的特征误差再次对未标记样本进行分类;最终,将两次分类
结果一致的样本被认为是高置信度的已见类样本或者开放集样本,分类结果不一致
的样本再次通过加权重新分配的方法进行调整。在相关数据集上进行了实验,实验
结果表明了提出方法的有效性。
综上所述,本文针对开放集识别中对未标记数据利用不足带来的问题,提出了
相应的有效利用未标记数据的开放集识别模型,为开放集识别提供了新思路。研究
成果对开放集识别领域有重要作用,可广泛应用于开放环境下的图像分类、人脸识
别等任务。
I
关键词:开放集识别;主动学习;PU学习;图像识别
II
ABSTRACT
Themainobjectiveofopensetrecognitionistoidentifynewclasssamplesin
unlabeleddatawhilecorrectlyclassifyingthesamplesofknownclasses.Inopenset
recognitiontasks,thecategoryspacesoftrainingsamplesandtestsamplesaredifferent,
andtestsamplescancomefromanyunknowncategory.Asanimportantresearch
directioninthefieldofmachinelearning,opensetrecognitionnotonlyhassignificant
scientificresearchsignificancefordiscoveringnewclasses,butalsoplaysanimportant
roleinpracticalapplicationssuchassecurity,autonomousdriving,andimagerecognition.
Currently,intherelatedresearchonopensetrecognition,methodsbasedonthresholds,
probabilisticmodels,anddeeplearninghaveallachievedaseriesofimportantresearch
results
您可能关注的文档
- 变译理论指导下American+Government+(节选)的译后编辑策略.pdf
- 城市群视角下城镇化对城市碳排放的影响研究.pdf
- 初一学生核心自我评价对主观幸福感的影响机制及干预研究.pdf
- 国有企业ZL的技术员工绩效管理研究.pdf
- 含C=C和C=O键不饱和化合物加氢脱氧反应机理的密度泛函理论研究.pdf
- 基于15分钟健身圈下太原市城区健身公园的体育资源配置和空间分布特征.pdf
- 基于DEM的非线性随机系统参数估计.pdf
- 基于LoRa技术的空气呼吸器状态监测系统设计与研究.pdf
- 基于SEM+fsQCA的数字平台互补者持续采用意向研究——以Android操作系统为例.pdf
- 基于定制极化KTP晶体的皮秒脉冲激光双穿倍频研究.pdf
- 高中生犯罪预防教育中的道德情感教育研究教学研究课题报告.docx
- 小学地理教学地球环境变化对生态系统影响的模拟模型构建教学研究课题报告.docx
- 初中生物国家课程校本化教学中的生态意识与可持续发展教育教学研究课题报告.docx
- 提升初中物理概念教学趣味性的策略与实践教学研究课题报告.docx
- 高中数学教学中数学建模能力的培养与评价研究教学研究课题报告.docx
- 高中手工课程创新皮具钱包制作中的数学与几何应用教学研究课题报告.docx
- 6 《职业院校实习实训基地建设与职业教育校企合作机制研究》教学研究课题报告.docx
- 《农产品冷链物流损耗控制与保鲜技术集成在冷链物流行业品牌建设中的应用》教学研究课题报告.docx
- 高中生职业素养培养与生涯教育课程实施路径研究教学研究课题报告.docx
- 基于人工智能技术的初中英语词汇游戏化教学系统开发教学研究课题报告.docx
最近下载
- 林肯电梯LCM28-Ⅱ模拟量一体式使用说明(1).pdf
- 水浒传中的30个主要人物的简介和主要事迹.docx
- PasswortD A1 听力原文-德语学习资料.pdf
- 施工安全风险分析及风控措施.pptx
- 佑风微WRMSB40J-WRMSB40K-WRMSB40M-UMSB规格书.pdf VIP
- 部编人教版语文七年级下册全册优秀课件(共2套-共1142张PPT).pptx
- 小学英语语法:一般过去时.ppt VIP
- 高一物理02平抛运动-讲义(教师版).pdf
- 桥梁工程毕业设计(论文)-3×30m预应力混凝土先简支后连续T型梁桥设计.doc VIP
- 07FJ02防空地下室建筑构造.docx VIP
文档评论(0)