- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 35卷 第 4期 燕山大学学报 、,01.35NO.4
2011年 7月 JournalofYanshanUniversity July 2011
文章编号;1007-791X (2011)04-370—07
基于高维空间凸壳数据描述的一类分类算法研究
胡正平 ,‘路 亮 ,冯春生
(1.燕山大学信息科学与工程学院,河北 秦皇岛 066004;2.机械工业出版社 高等教育分社,北京市 100037)
摘 要:一类分类 问题的研究 目标是设计 目标类样本的覆盖函数,理想情况下使得 目标类样本被接受,所有非
目标类的样本被拒绝。经典SVDD覆盖模型寻找包含训练数据的最小半径超球对其进行覆盖,该模型对非规则
复杂分布的数据描述存在较多的冗余区域。本文提出一种基于训练集样本凸壳数据描述 (ConvexHullDataDe.
scription,CHDD)的紧致覆盖模型。该模型无须参数设置,可实现对样本非规则复杂分布 的 自适应覆盖,并可
通过利用核函数方法获得更强的非线性分类能力。当训练集包含噪声样本时,通过拒绝一定比例的目标类样本
可获得更为鲁棒的凸壳边界描述。在UCI数据库、M-NIST手写体数据库和MIT-CBCL人脸识别数据库上的实
验结果表明了本文方法的有效性,相比现有一类分类算法,CHDD取得更好的分类效果。
关键词:一类分类器;高维空间;凸壳数据描述
中图分类号:TP181 文献标识码:A DOI:10.3969~.issn.1007·791X.2011.O4.017
0 引言 Parzen窗函数法。在 目标样本集维数较低且样本数
较多时密度函数法比较有效,但在高维有限样本情
传统基于划分分类的模式识别方法一般需要 况下,密度估计的方法不能真实反映模式的特征,
多个类别的训练样本,用来设计两类和多类分类 难以对 目标类数据的稀疏区域做出正确识别。2)神
器。然而在实际应用中存在许多一类分类问题 】, 经网络模型主要包括 自动编码器 (Auto-Encoders)、
比如:基于生物特征的身份识别和验证 ,机器故 学习矢量量化 (LearningVectorQuantization,LVQ)
障检测 口,异常行为检测 Ⅲ,疾病检测 ,文本分 和 自组织特征映射 (Self-organizingMap,SOM)
类 等等。在这些问题中,几乎无法获取多类样 等川。神经网络模型对一些大规模和非线性问题有
本,或者获取代价极高 (如在机器故障检测中,为 较好的分类效果,其缺点在于网络训练需预先确定
了获取异常样本而故意破坏机器设备),或者获取 很多参数,如网络隐层数和每层神经元数 目。3)数
的异常样本不可信任 (盎日在基于人脸图像的身份识 据聚类模型认为 目标类样本满足某种聚类假设,对
别中,任意非本人的人脸图像或者非人脸图像都属 数据进行聚类,以测试样本到最近簇类中心的距离
于异常样本)。和两类分类问题不同,由于仅有一 判定是否为 目标类,~tNk-means~Hk-centers。数据
类样本可用,一类分类器的设计 目标是确定 目标类 聚类模型有较低 的运算复杂度,然而这些方法对簇
样本的覆盖函数,使得 目标类的样本被接受,而非 类中心的选择非常敏感,且簇类数雄呈的选取仍然
目标类的样本被拒绝 口。 是开放问题。为此陈斌等人 提出基于单簇聚类
国内外学者已经提出一些一类分类器的设计 的数据描述方法,避免了簇类数选择的问题。4)边
思路,根据其原理大致可分为4类:密度函数法
文档评论(0)