基于邻域关系模糊粗糙集的分类新方法.docVIP

基于邻域关系模糊粗糙集的分类新方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于邻域关系模糊粗糙集的分类新方法.doc

基于邻域关系模糊粗糙集的分类新方法 摘要:针对目前模糊等价关系所诱导的模糊粗糙集模型不能准确地反映模糊概念范畴中数值属性描述的决策问题,提出一种基于邻域关系的模糊粗糙集模型NRFRS,给出了该粗糙集模型的相关定义,在讨论模型性质的基础上进行模糊化邻域近似空间上的推理,并分析特征子空间下的属性依赖性;最后在NRFRS的基础上提出特征选择算法,构建使得模糊正域增益优于具体阈值的特征子集,进而剔除冗余特征,保留分类能力强的属性。采用UCI标准数据集进行分类实验,使用径向基核函数(RBF)支持向量机作为分类器。实验结果表明,同基于邻域粗糙集的快速前向特征选择方法以及核主成分分析方法(KPCA)相比,NRFRS模型特征选择算法所得特征子集中特征数量依据参数变化更加平缓、稳定。同时平均分类准确率提升最好可以达到5.2%,且随特征选择参数呈现更加平稳的变化。 关键词:粒化和逼近;特征选择;邻域关系;属性依赖性 中图分类号: TP181 0引言 人类认识事物的过程是从建立概念开始的,在此基础上进行思维上的逼近,最终作出判断和决策。Pawlak粗糙集[1]在30多年的发展过程中,始终以人的认识方法为出发点,从粒化和逼近两个方面进行拓展。无论是在诸如人工智能、数据挖掘和机器学习等技术应用领域,还是在本身的模型理论创新方面都取得了较为显著的成果。然而,由于人类的思维世界是纷繁复杂并且模糊的,最初基于等价关系的经典粗糙集仅仅能够反映最为原始的思维模型[2]。面对这些问题,相关领域的专家学者纷纷从模型的粒化和逼近两个角度出发,提出了许多经典粗糙集的泛化模型。在逼近方面,1992年,Yao[3-5]提出决策理论粗糙集,通过结合决策以及相应的决策容错机制给出约简算法以及属性重要度的衡量方法,这个概念可以更好地模拟人类思维的不确定性。1993年,研究人员提出了可变精度粗糙集(Variable Precision Rough Set,VPRS)模型[6],允许一定的噪声存在,以包含度阈值来划分等价类。2005年,在VPRS模型的基础上引入随机概念,泛化产生概率粗糙集模型[7-8]以及贝叶斯粗糙集模型[9]。在粒化形式方面,Dubois和Prade将模糊概念引入经典粗糙集,形成粗糙模糊集[10]以及模糊粗糙集[11]的概念,从而在模糊等价关系的基础上进行推理。1990年Lin等[12]提出了邻域粗糙集的概念,使用邻域关系这种新的粒化方式来实施论域的逼近。在决策分析中,相关学者针对有序分类问题引入了优势关系粗糙集模型[13],用于决策属性间包含序结构的情况。 由于人类思维方式中存在着大量模糊性和复杂性,基于模糊思想的粒化以及逼近思想贯穿人类认识的发展全过程。虽然已经提出了诸多经典粗糙集的泛化模型,例如优势关系、相似关系和邻域关系等。然而目前大多数模糊粗糙集是基于模糊等价关系的,等价关系只能够简单反映各种概念结构。对于现有结合模糊粗糙集方法进行特征选择的分类方法而言,主要缺乏研究反映数值型属性以及混合值属性刻画的决策问题。原始的以等价关系或者模糊等价关系为基础的粗糙集模型在处理简单清晰概念的决策问题时能够获得理想的效果,面对模糊环境下复杂多变的数据类型,如何更好地对包括数值属性在内的特征进行准确的反映,是需要考虑的问题。因此,本文结合文献[14-16]中所阐述的邻域粗糙集以及前人在此方面所作的深入研究,将邻域关系引入模糊粗糙集中,提出一种基于邻域关系的模糊粗糙集模型(Neighborhood Relation basis Fuzzy Rough Set, NRFRS),以及相应的属性依赖性分析和特征选择算法。在借鉴快速前向属性选择算法[14]思想的同时,引入正域增益阈值α的概念,构造基于NRFRS的特征选择算法NRFRSReduction。最后通过实验证明方法的有效性,本文将NRFRSReduction 算法应用于UCI[17]标准数据集分类中,使用其进行数据预处理中的特征选择,使用RBFSVM作为分类器。实验结果显示,NRFRSReduction算法所对应的分类精度高于基于邻域粗糙集的前向属性约简算法(Naive Forward Attribute Reduct based on Neighborhood Rough Set model, NFARNRS)[18-19]以及核主成分分析方法(Kernel Principal Component Analysis, KPCA)[20]所对应的分类精度。 1相关理论 1.1模糊关系 普通关系只描述了元素彼此是否存在关联。模糊关系则可以具体描述元素间关联的程度, 它是模糊集合中较为基础的概念。 定义1[21] 假设U与V分别表示两个非空有限论域,U×V (u,v):u∈U,v∈V 称为U与V的笛卡尔乘积,称U×V的任意

文档评论(0)

ganpeid + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档