考虑属性排名的约简算法.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机技术 与发展. .第 卷 第 期 年 月 . 、 考虑属性排名的约简算法 朱晓钟 ,一,杨 勇 ,朱英丽.西北师范大学数学与信息科学学院,甘肃兰州 ; .河海大学计算机与信息学院,江苏常州 摘 要:属性约简是粗糙集研究的重要内容之一。目前有多种计算约简集的方法,但计算效率普遍不高。杨萍等学者提 出的基于二进制区分矩阵的启发式约简算法,考虑了属性的区分度和区分率,采用高效的逻辑运算获得约简集,提高了运 算的效率。在该算法的基础上,首先指出其计算所得的约简集存在不确定性,然后给出一种考虑属性排名的改进的约简 算法,消除了约简集的不确定性,并且可以迎合用户的需求。最后通过一个信息系统实例,验证该算法的可行性和有效 性。 关键词:属性排名;粗糙集;属性约简;二进制区分矩阵 中图分类号:文献标识码: 文章编号:? ? 一,一,, ? .,, , ; . , , , : ./,. ?, ? ,。 ’? , ’ , ?... . : ; ; ; 的任一概念 。引 言 属性约简是数据挖掘和粗糙集理论的核心内容之 粗糙集理论作为一种新的处理不确定性的有效数 一 ,其目的是找到决策表的主要属性。大多数情况下, 学工具,在计算机科学与技术领域中发挥了重要的作 近似空间中的属性并不是同等重要的,甚至某些属性 用。该理论由于 年首先提出 , 世纪 是冗余的。为此需要进行属性约简。现有的属性约简年代开始得到快速发展。经典粗糙集理论以等价 算法,如基于正区域的约简算法 、基于区分矩阵中 关系 自反性、对称性、传递性 为基础,通过等价关系 属性频率的约简算法,以及基于信息熵的约简算 对论域进行划分,而知识即表现为等价关系对论域划 法‘等,都能得到合理的属性约简,但这些算法的复杂 分的结果,划分越细,知识越精确。为描述知识不确定 度依然较高。最近,杨萍等人 提出了利用二进制区 性,粗糙集理论通过引入上、下近似运算来逼近论域中 分矩阵并考虑属性的区分度和区分率进行属性约简的 新思路,实例证明了该算法的合理性和有效性,在属性 收稿日期: 一 ? ;修回日期: 约简中显示出其独特性。但遗憾的是,该算法在条件 基金项目:国家自然科学基金:兰州市科技计划项目 属性具有相同区分度和区分率时,采用了随机任意选 一 一 择的策略,因此所得的属性约简集有随机性。文中基 作者简介:朱晓钟 一 ,男,硕士,讲师,会员,研究方向为 机糙集理沦及数据挖掘;杨 勇,博士,副教授,研究方向为粗糙集 于文献 中的已有算法,通过引入用户对属性的排 蠼沧凌萁应用。 名 ,消除了不确定性,进一步完善了该约简算法。第 期 朱晓钟等:考虑属性排名的约简算法 :初始化, : ; 粗糙集基本概念:将值填人 ; . 信息系统和近似集合 ; ; 定义 四元组 , , , 是一个信息系 ;; 统,其中: 为对象的非空有限集合; 为属性的非空 , ≠ ,, 有限集合;, 是属性 的值域;厂: × ? .; :; 是一个信息函数,它为每个对象的每个属性赋予一 , ≠厂 , 个信息值,即对任意 ∈ , ∈ , , ∈ 。 , , 定义 设,。 关于 的下近似、 上近似分别定义为: 厂 , , . ∈; ∈≠ 。其中 表示 划分下包含:输出 ,程序结束。 元素 ∈ 的等价类。一个等价类中所有对象之间具 二进制区分矩阵直接描述了论域中对象之间的分 有不可区分关系。 辨情况。若矩阵中某个元素为 或 ,则说明所在的行 . 区分矩阵及属性约简 属于不同决策的两个对象,这两个对象在 或 所在 定义 给定决策表 , , ,.厂 ,其 的列属性下可分辨或不可分辨。此外,若二进制区分矩 中 是条件属性集, 是决策属性集,区分矩阵 阵中有全为 的行,则说明相应的决策表是不协调的, 定义为: 否则决策表是协调的;若某一行的元素全为 ,说明相 口∈ ;厂五, ≠ ,口 , 应的两个对象在决策表 的任何一个条件属性下都可当 , ≠,, 时 分辨,此时去掉这一行不影响约简;若某一行只有一个 ,其他 元素为 ,其余元素均为 ,则这个元素 对应的条件属 定义 令 为一族等价关系, ∈ ,若 性一定属于核属性。一,则称 为 中不必要的,否则称 为 定义 加 属性的区分度定义为:中必要的。若对于每一个 ∈ 都是 中必要的,则 ∑ , ,,其中 ,,?, ;忌 ,, 称 为独立的,否则称尺为依赖的。定义 设,如果 是独立的,且。 是二进制区分矩阵中第 列元素之 ,,则称 为 的一个约简。显然可知 有多种 和,它表示属性 能区分的对象对的个数。区分度越 约简。 中所有必要属性组成的集合称为 的核 强,属性的重要性越大。 ,记作。 ,其中 定义 属性的区分率

文档评论(0)

jsntrgzxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档