基于高维空间凸壳数据描述的一类分类算法研究.pdfVIP

基于高维空间凸壳数据描述的一类分类算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 35卷 第 4期 燕山大学学报 、,01.35NO.4 2011年 7月 JournalofYanshanUniversity July 2011 文章编号;1007-791X (2011)04-370—07 基于高维空间凸壳数据描述的一类分类算法研究 胡正平 ,‘路 亮 ,冯春生 (1.燕山大学信息科学与工程学院,河北 秦皇岛 066004;2.机械工业出版社 高等教育分社,北京市 100037) 摘 要:一类分类 问题的研究 目标是设计 目标类样本的覆盖函数,理想情况下使得 目标类样本被接受,所有非 目标类的样本被拒绝。经典SVDD覆盖模型寻找包含训练数据的最小半径超球对其进行覆盖,该模型对非规则 复杂分布的数据描述存在较多的冗余区域。本文提出一种基于训练集样本凸壳数据描述 (ConvexHullDataDe. scription,CHDD)的紧致覆盖模型。该模型无须参数设置,可实现对样本非规则复杂分布 的 自适应覆盖,并可 通过利用核函数方法获得更强的非线性分类能力。当训练集包含噪声样本时,通过拒绝一定比例的目标类样本 可获得更为鲁棒的凸壳边界描述。在UCI数据库、M-NIST手写体数据库和MIT-CBCL人脸识别数据库上的实 验结果表明了本文方法的有效性,相比现有一类分类算法,CHDD取得更好的分类效果。 关键词:一类分类器;高维空间;凸壳数据描述 中图分类号:TP181 文献标识码:A DOI:10.3969~.issn.1007·791X.2011.O4.017 0 引言 Parzen窗函数法。在 目标样本集维数较低且样本数 较多时密度函数法比较有效,但在高维有限样本情 传统基于划分分类的模式识别方法一般需要 况下,密度估计的方法不能真实反映模式的特征, 多个类别的训练样本,用来设计两类和多类分类 难以对 目标类数据的稀疏区域做出正确识别。2)神 器。然而在实际应用中存在许多一类分类问题 】, 经网络模型主要包括 自动编码器 (Auto-Encoders)、 比如:基于生物特征的身份识别和验证 ,机器故 学习矢量量化 (LearningVectorQuantization,LVQ) 障检测 口,异常行为检测 Ⅲ,疾病检测 ,文本分 和 自组织特征映射 (Self-organizingMap,SOM) 类 等等。在这些问题中,几乎无法获取多类样 等川。神经网络模型对一些大规模和非线性问题有 本,或者获取代价极高 (如在机器故障检测中,为 较好的分类效果,其缺点在于网络训练需预先确定 了获取异常样本而故意破坏机器设备),或者获取 很多参数,如网络隐层数和每层神经元数 目。3)数 的异常样本不可信任 (盎日在基于人脸图像的身份识 据聚类模型认为 目标类样本满足某种聚类假设,对 别中,任意非本人的人脸图像或者非人脸图像都属 数据进行聚类,以测试样本到最近簇类中心的距离 于异常样本)。和两类分类问题不同,由于仅有一 判定是否为 目标类,~tNk-means~Hk-centers。数据 类样本可用,一类分类器的设计 目标是确定 目标类 聚类模型有较低 的运算复杂度,然而这些方法对簇 样本的覆盖函数,使得 目标类的样本被接受,而非 类中心的选择非常敏感,且簇类数雄呈的选取仍然 目标类的样本被拒绝 口。 是开放问题。为此陈斌等人 提出基于单簇聚类 国内外学者已经提出一些一类分类器的设计 的数据描述方法,避免了簇类数选择的问题。4)边 思路,根据其原理大致可分为4类:密度函数法

文档评论(0)

liyxi26 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档