- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机技术 与发展. .第 卷 第 期 年 月 . 、
考虑属性排名的约简算法
朱晓钟 ,一,杨 勇 ,朱英丽.西北师范大学数学与信息科学学院,甘肃兰州 ;
.河海大学计算机与信息学院,江苏常州
摘 要:属性约简是粗糙集研究的重要内容之一。目前有多种计算约简集的方法,但计算效率普遍不高。杨萍等学者提
出的基于二进制区分矩阵的启发式约简算法,考虑了属性的区分度和区分率,采用高效的逻辑运算获得约简集,提高了运
算的效率。在该算法的基础上,首先指出其计算所得的约简集存在不确定性,然后给出一种考虑属性排名的改进的约简
算法,消除了约简集的不确定性,并且可以迎合用户的需求。最后通过一个信息系统实例,验证该算法的可行性和有效
性。
关键词:属性排名;粗糙集;属性约简;二进制区分矩阵
中图分类号:文献标识码: 文章编号:? ? 一,一,, ?
.,, , ;
. , , , : ./,. ?, ? ,。 ’?
, ’ , ?... . : ; ; ;
的任一概念 。引 言
属性约简是数据挖掘和粗糙集理论的核心内容之
粗糙集理论作为一种新的处理不确定性的有效数
一
,其目的是找到决策表的主要属性。大多数情况下,
学工具,在计算机科学与技术领域中发挥了重要的作
近似空间中的属性并不是同等重要的,甚至某些属性
用。该理论由于 年首先提出 , 世纪
是冗余的。为此需要进行属性约简。现有的属性约简年代开始得到快速发展。经典粗糙集理论以等价
算法,如基于正区域的约简算法 、基于区分矩阵中
关系 自反性、对称性、传递性 为基础,通过等价关系
属性频率的约简算法,以及基于信息熵的约简算
对论域进行划分,而知识即表现为等价关系对论域划
法‘等,都能得到合理的属性约简,但这些算法的复杂
分的结果,划分越细,知识越精确。为描述知识不确定
度依然较高。最近,杨萍等人 提出了利用二进制区
性,粗糙集理论通过引入上、下近似运算来逼近论域中
分矩阵并考虑属性的区分度和区分率进行属性约简的
新思路,实例证明了该算法的合理性和有效性,在属性
收稿日期: 一 ? ;修回日期:
约简中显示出其独特性。但遗憾的是,该算法在条件
基金项目:国家自然科学基金:兰州市科技计划项目
属性具有相同区分度和区分率时,采用了随机任意选 一 一
择的策略,因此所得的属性约简集有随机性。文中基
作者简介:朱晓钟 一 ,男,硕士,讲师,会员,研究方向为
机糙集理沦及数据挖掘;杨 勇,博士,副教授,研究方向为粗糙集 于文献 中的已有算法,通过引入用户对属性的排
蠼沧凌萁应用。
名 ,消除了不确定性,进一步完善了该约简算法。第 期 朱晓钟等:考虑属性排名的约简算法 :初始化, : ;
粗糙集基本概念:将值填人 ;
. 信息系统和近似集合 ; ;
定义 四元组 , , , 是一个信息系 ;;
统,其中: 为对象的非空有限集合; 为属性的非空 , ≠ ,,
有限集合;, 是属性 的值域;厂: × ?
.; :;
是一个信息函数,它为每个对象的每个属性赋予一 , ≠厂 ,
个信息值,即对任意 ∈ , ∈ , , ∈ 。 , ,
定义 设,。 关于 的下近似、
上近似分别定义为:
厂 , ,
. ∈;
∈≠ 。其中 表示 划分下包含:输出 ,程序结束。
元素 ∈ 的等价类。一个等价类中所有对象之间具
二进制区分矩阵直接描述了论域中对象之间的分
有不可区分关系。
辨情况。若矩阵中某个元素为 或 ,则说明所在的行
. 区分矩阵及属性约简
属于不同决策的两个对象,这两个对象在 或 所在
定义 给定决策表 , , ,.厂 ,其
的列属性下可分辨或不可分辨。此外,若二进制区分矩
中 是条件属性集, 是决策属性集,区分矩阵
阵中有全为 的行,则说明相应的决策表是不协调的, 定义为:
否则决策表是协调的;若某一行的元素全为 ,说明相
口∈ ;厂五, ≠ ,口 ,
应的两个对象在决策表 的任何一个条件属性下都可当 , ≠,, 时
分辨,此时去掉这一行不影响约简;若某一行只有一个
,其他
元素为 ,其余元素均为 ,则这个元素 对应的条件属
定义 令 为一族等价关系, ∈ ,若
性一定属于核属性。一,则称 为 中不必要的,否则称 为
定义 加 属性的区分度定义为:中必要的。若对于每一个 ∈ 都是 中必要的,则
∑ , ,,其中 ,,?, ;忌 ,,
称 为独立的,否则称尺为依赖的。定义 设,如果 是独立的,且。 是二进制区分矩阵中第 列元素之
,,则称 为 的一个约简。显然可知 有多种
和,它表示属性 能区分的对象对的个数。区分度越
约简。 中所有必要属性组成的集合称为 的核 强,属性的重要性越大。 ,记作。 ,其中
定义 属性的区分率
您可能关注的文档
最近下载
- 桂皮醛在常用溶剂中稳定性考察—.PDF VIP
- 党群部笔试题目及答案解析.doc VIP
- 党群办公室笔试题目及答案.doc VIP
- 党群部笔试题目及答案.doc VIP
- (2025)党群部笔试题目与答案.docx VIP
- ASTM E1820-24 Standard Test Method for Measurement of Fracture Toughness 断裂韧性测量的标准试验方法.pdf
- 雷克萨斯-Lexus LS-产品使用说明书-LS460L-USF46L-AEZGHC5-LS460LOM50E87C-1509.pdf VIP
- 2014最好的十个企业即时通讯软件排名 .doc VIP
- 2025届职教高考语文复习学习任务3-1科学类文本阅读课件(共95张PPT)(广东省).ppt VIP
- 工段长述职发言稿.pptx VIP
文档评论(0)