- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第?29 卷第?1 期
2012 年?1 月?
计 算 机 应 用 研 究
Application Research of Computers
基于粗糙集的属性约简方法研究综述
倡
Vol畅29 No畅1
杨传健?, 葛 浩?, 汪志圣
(滁州学院 a.计算机系; b.电子信息工程系; c.数学系, 安徽 滁州?239012)
摘 要: 针对经典粗糙集理论的属性约简,从三个方面对属性约简方法进行综述。 最后对属性约简中存在的问
题进行了分析,并提出了进一步研究的方向。
关键词: 知识发现; 粗糙集; 属性约简; 可分辨矩阵; 正区域
中图分类号: TP181? 文献标志码: A 文章编号:?1001?唱3695?(?2012?)?01?唱0016?唱05
doi:10?.3969?/.issn.1001?唱3695.2012?.01?.004
Overview of attribute reduction based on rough set
a b c
(a.Dept.of Computer Science, b.Dept.of Electronic & Information Engineering, c.Dept.of Mathematics, Chuzhou University, Chuzhou An唱
hui?239012?, China)
Abstract: For attribute reduction of classical rough set theory,this paper reviewed reduction methods in three areas.Finally,
Key words: knowledge discovery; rough set; attribute reduction; discernibility matrix; positive region
随着大规模数据库的广泛使用和 Internet 迅猛发展,数据
库中存储的数据量越来越大,且数据还在不断动态变化。 需要
采用有效的工具来处理这些大量的、杂乱无章的数据,并从这
些数据中提取出隐含于其中的可为人们所用的规律。 粗糙集
理论(rough set theory, RST)是一种处理不精确、不一致与不完
[1]
的,能在保持分类能力不变的前提下,通过知识约简获得知识
的分类规则。 与其他方法相比,粗糙集方法不需要先验知识,
仅利用数据本身所提供的信息发现问题的规律。 粗糙集理论
具有较好的可结合性,可以与其他理论相互结合,取长补短。
例如,粗糙集理论可以与模糊集理论、神经网络、遗传算法、证
据理论、概念格和归纳逻辑程序设计等其他智能理论结合,实
现更强大和更优良的功能。
属性约简是粗糙集理论研究的核心内容之一,它是在保持
知识库分类能力不变的条件下,删除其中不相关或不重要的属
性。 通过属性约简可以从特征信息中提取有用的信息,简化知
识处理过程。 本文将对经典粗糙集理论的属性约简方法进行
综述,并对今后的发展和研究进行展望。 关于粗糙集理论的基
本概念请参阅文献[1]?。
1 属性约简方法的研究
1畅1? 静态信息系统属性约简
信息系统(或称决策表)的属性约简一般不是唯一的,人
[2]
明求解决策表的所有约简和最小约简是 NP唱ard 问题。 为此,
通常采用启发式的方法进行属性约简。 常用的启发式算法有
基于信息熵的属性约简算法、基于可分辨矩阵的属性约简算法
和基于正区域的属性约简算法。 大多数启发式约简算法的基
本思路是以核属性为起点,然后根据属性重要性的某种测度,
依次选择核属性以外未被添加到约简集中最重要的属性,将其
加入到约简集中,直到满足终止条件;由此得到决策表的一个
约简。
1畅畅 基于信息观的属性约简方法
苗夺谦等人 从互信息量角度对决策表中属性重要性进
行了定义,以此作为启发式信息,减小知识约简过程中的搜索
空间,并在此基础上提出了基于互信息量的属性约简算法???
MIBARK 算法。 该算法多数情况下能够得到决策表的最小约
简,但在决定如何扩展候选属性约简集时,必须对条件属性进
2
3??????????????????????????????????????????????????????????????????????????????????[?4]
法以初始条件属性集为起点,逐步删除使决策属性 D 相对条
件属性 a 的条件熵 H(D?|a}?)值大的属性 a 来实现约简,其算
2??????????????????????3
算法以核属性集为起点,逐次选择使 H(D?|B∪{a}?)最小的非
核条件属性 a 添加到核属性集中
文档评论(0)