- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进的基于区分矩阵的属性约简算法
张永平 李娜
(中国矿业大学 计算机科学与技术学院,江苏 徐州 221008)
摘要:以属性在区分矩阵中出现的频率作为启发,对HORAFA算法做了一些改进。引入二进制可辨识矩阵,对区分函数进行简化,求出相对核。以相对核为基础,加入属性重要性最大的属性,直到不能再加。在此基础上,加上反向消除的过程,保证了算法的完整性。
关键词:粗糙集;属性约简;区分矩阵;二进制可辨识矩阵
中图法分类号:TP311 文献标识码:A
A new algorithm of attribute reduction based on discernibly matrix
ZHANG Yong-ping LI Na
(School of Computer Science and Technology, China University of Mining and Technology, 221008, China)
Abstract:The paper learns something from the frequency of attributes appeared in the discernibly matrix, and makes progress on the HORAFA. Lead binary discernibly matrix in, and make the discernibly function more simplify, and then find the core. The algorithm adds the most important attribute into the core until can’t add anymore. Then add a process of backward elimination to make sure the completeness of algorithm.
Key words:Rough sets; attribute reduction; discernibly matrix; binary discernibly matrix
一、引言
粗糙集理论是波兰数学家Z.Pawlak在20世纪80年代初首先提出的一种可以分析模糊和不确定问题的数学理论[1],目前正在被广泛应用于机器学习、决策分析、过程控制、模式识别和数据挖掘等领域。
属性约简是粗糙集理论中所研究的热门问题之一,通过属性约简,可以剔除知识库中的冗余知识(属性),发现知识库中隐含的关联和规则,帮助人们做出正确简捷的决策。约简通常不是唯一的,约简中属性个数的多少直接影响着属性值的约简过程和决策规则的繁简。
二、粗糙集理论的基本概念
粗糙集理论的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集出发,通过不可分辨关系(等价关系)确定给定问题的近似域,从而找出该问题中的内在规律。下面先给出粗糙集理论中的基本概念[2]。
定义2-1 设S=(U,A,V,f)是一个信息系统,又设C,D∈A且C∩D= ,C∪D=A分别称C和D为A的条件属性集和决策属性集,如此的信息系统S称为决策表,记为T=(U,C,D,V,f)。
定义2-2 设S=(U,A,V,f)是一个信息系统,A中所有必要的属性组成的集合称为属性集A的核,记为core(A)。
定义2-3 设S=(U,A,V,f)是一个信息系统,P MACROBUTTON MTEditEquationSection2 SEQ MTEqn \r \h \* MERGEFORMAT SEQ MTSec \r 1 \h \* MERGEFORMAT SEQ MTChap \h \* MERGEFORMAT A,如,ind(P)=ind(A)并且P是独立的,则称P是A的一个约简(对决策表称为相对约简)。可以证明核是约简的交集。
定义2-4 区分矩阵[2]:给定一个信息系统S=(U,A,V,f),A=C∪D是属性集合,C,D分别是条件属性和决策属性。区分矩阵M=(mij)定义为:
mij=
其中a(x)是元祖x在属性C上的取值,D(x)是x在决策属性D上的取值[2,3]。
定义2-5 二进制可辨识矩阵:设决策表为T=(U,C,D,V,f),其中U={u1,u2,……,un},C={c1,c2,……,cn},D={d}。则决策表T对应的二进制可辨识矩阵MT构造如下[2]。
矩阵MT的一列对应一个条件属性,共有m列;每一行对应论域中的一个对象对(up,uq),且d(up)d(uq),即这一对象对属于不同的决策类。MT至多有n(n-1)/2行,即每一个对象都对应一个决策类。设矩阵中某一元素m((p,q),i
文档评论(0)