基于树型结构的属性约简算法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于树型结构的属性约简算法   摘要:该文对粗糙集理论进行了研究,提出一种基于树的约简算法。该算法的特点是能够得到决策表的所有约简,并且适合相容决策表和不相容决策表。通过构造约简树,得到基于约简树的决策表的极小属性集,最后通过实例来验证该算法。   关键词:粗糙集;属性约简;树型结构   中图分类号:TP311文献标识码:A 文章编号:1009-3044(2009)31-00000-00      Attribute Reduction Approach Based on Tree Structure   LI Shu-chen   (Lanzhou Jiaotong University, College of Electronics and Information Engineering,Lanzhou 730070,China)   Abstract:In this paper an algorithm was proposed based on tree structure through studied the rough set theory. The algorithm can get all of the reduction of decision table, and it’s suitable for compatible and incompatible decision table. We can get the minimal decision table attribute set based on reduction tree. Finally, give an example to validate the algorithm.   Key words: rough set; attribute reduction; tree structure      粗糙集(Rough Set)理论是由波兰数学家Pawlak在1982年提出的一种数据分析理论,常用于处理模糊和不精确的问题。它可以从大量的数据中挖掘潜在的、有利用价值的知识,它与概率方法、模糊集方法和证据理论方法等其他处理不确定性问题理论的最显著的区别在于:它无需提供问题所需处理的数据集合的任何先验信息(即无需指定隶属度和隶属函数)。   属性约简是指在不影响知识表达能力的条件下,通过消除冗余知识,从而获得知识库的简洁表达的方法。在粗糙集理论中,在保持信息系统分类或决策能力不变的前提下,通过消除冗余属性和冗余属性值,最终得到信息系统的分类或决策规则的方法。对于目前常用的属性约简算法,由于常用的两个属性重要性的定义不一,在约简中有时出现矛盾,特别是当几个可约简属性的重要性相等时,如何选择与决策属性相似性程度高的条件属性,就显得无能为力。到目前为止,已经提出了一些约简算法,然而却没有找到一个公认的、高效的约简算法。因此,粗糙集理论高效、最优的约简算法仍然需要研究,本文是通过约简树型方法对决策表中的属性进行约简。   1 基本概念   定义1:设非空集U是我们感兴趣的对象组成的有限集合,称为论域。   定义2:设R是U上的一个等价关系,U/R表示R的所有等价类(或者U上的分类)构成的集合,[X]R表示包含元素X∈U的R等价类。   定义3:一个知识库就是一个关系系统K=(U,R),其中U为非空有限集,称为论域,R是U上的一族等价关系。   定义4:设Q?哿P,如果Q是独立的,且ind(Q)=ind(P),则称Q为P的一个约简。显然P可以有多种约简。P中所有必要关系组成的集合称为P的核,记作Core(P)。核与约简有如下关系:Core(P)=∩Red(P)。   定义5:一个信息系统S可以表示为S=,其中:   U:对象的非空有限集合,称为论域;   A:属性的非空有限集合:   V=∪Va, 是属性a的值域;   f:U×A→V是一个信息函数,它为每个对象的每个属性赋予一个信息值,即?坌a∈A, x∈U, f(x,a)∈Va。   定义6:决策表是一类特殊而重要的知识表达系统,其定义如下:S=(U,A,V,f)为一知识表达系统,且A=C∪D,C∩D=Φ,C称为条件属性集,D称为决策属性集。具有条件属性和决策属性的知识表达系统可表示为决策表。   定义7:一个决策表的属性约简过程可以表示成一棵多叉树,简称约简树。约简树的根节点是条件属性全集,每个结点都是条件属性全集的某个子集,树的每条边都代表一个属性,父子节点之间的一条边表示从父节点中删除了该属性而生成该子结点。   定义8:设一个决策表T=(U,C∪{d},V,f),C为条件属性,d为决策属性,令A?奂C,x,y∈U,若f(x,A)=f(y,A)且

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档