网站大量收购独家精品文档,联系QQ:2885784924

基于信息熵的粗糙集知识约简方法研究.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
..:一侍I第十届粤港机电工程技术与应用研讨会_鎏天培教授纪念台1,一、 X毕l“絮::嚣般:::ii:::忽裂器:舞篇甚掣2=:::I、。■一? 一芎茎茎薹薹茎;;;ii÷鼍孳苎苎,墨皇璺■————■——, 基于信息熵的粗糙集知识约简方法 闫华 (广东技术师范学院机电学院,广东广州510665) 摘要:知识约简是粗糙集理论的核心内容之一。本文提出了知识的信息熵的概念.通过知识的信息熵对属性的重要性进行了定 义,提出了基于信息熵的粗糙集知识约简方法.并通过实例进行J,分析。分析结果表明基于信息熵的粗糙集知识约简方法是行 之有效的。 关键词:粗糙集;知识约简;信息熵 粗糙集理论…是用于处理不精确、不完全数据的一 (1)近似分类质量 种数学方法。其基本思想是,在保持系统分类能力不变 ‘(D)=Card(P08e(D)),Card(U) 的前提下.通过知识约简,删除其中的冗余属性,导出 式中,‘(D)为根据属性c,由属性D所决定的论域u的 问题的决策规则。知识约简是粗糙集理论的重要内容之 划分的近似分类质量。ca坩(∞%(D))为根据c划分的等价 一。本文首先对粗糙集的基本概念进行了简要的概括, 类中,能够完全确定地归入根据D划分的等价类中的元 然后提出了知识的信息熵的概念,并提出了基于信息熵 素的个数。ff∞-d(U)为U中所有元素的个数。 的属性重要性的度量方法。最后,用这种方法对一实际 (2)属性c(C∈C)对决策属性D的重要性 的加工过程数据进行了知识约简,并与用经典粗集理论 匕(D)=re(D)一仁¨(D) (1) 知识约简的结果相比较,证明此方法足可行的。 艺(D)度量从原始决策表中去掉属性C后,决策分类 的变化程度.其值越大,表明它将分类改变得越多,属 1粗糙集基本概念 性c对决策属性集D的重要性越大”1。 1.1知识与不可分辨关系 粗集理论认为,知识是对对象的分类能力。我们将 2基于信息熵的粗糙集知识约简方法 所研究的对象的集合称为论域,知识即是由我们感兴趣 2.1知识的信息熵 的论域的分类模式组成的。 信息熵由于其处理不确定性问题的优势,目前已被 假设给定某对象的论域U,R--CuD为论域中的属性很多学者用来作为粗糙集研究中不确定性的度量”41。目 集合,其中c为条件属性集,D为决策属性集。对于x,Y 前的额研究存在一个问题.即如果直接利用信息熵的定 ∈U,pc:R,如果满足V P∈P:,,(z)=/,p),‘(神和‘(y)为义来反映粗糙集中的不确定性,得出的结论是知识的粗 对象x,yX}应于属性P的属性值,则称对象x,yX寸于属性 糙性越小,它的熵值反而越大,这与信息熵的物理概念 集合P是不可区分的。这种由属性集合P决定的不可分辨 是不符的。为了解决前述的第一个问题,很多学者引入 关系记为IND(P)。即: 了粗糙熵的概念”1。本文在此给出知识的信息熵的概 厨以尸)-Ux,,)EUxuI坳EP,五(砷一矗∽j 念。 1.2知识的约简 设U为一论域,R=cuD为论域中的属性集合,其中 e为u上的一个 在粗集理论中,知识的约简可以认为是从知识基中 C为条件属性集,D为决策属性集。∥e 去除一些多余的等价关系,同时维持原有的等价关系不

文档评论(0)

精品课件 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档