- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
..:一侍I第十届粤港机电工程技术与应用研讨会_鎏天培教授纪念台1,一、
X毕l“絮::嚣般:::ii:::忽裂器:舞篇甚掣2=:::I、。■一?
一芎茎茎薹薹茎;;;ii÷鼍孳苎苎,墨皇璺■————■——,
基于信息熵的粗糙集知识约简方法
闫华
(广东技术师范学院机电学院,广东广州510665)
摘要:知识约简是粗糙集理论的核心内容之一。本文提出了知识的信息熵的概念.通过知识的信息熵对属性的重要性进行了定
义,提出了基于信息熵的粗糙集知识约简方法.并通过实例进行J,分析。分析结果表明基于信息熵的粗糙集知识约简方法是行
之有效的。
关键词:粗糙集;知识约简;信息熵
粗糙集理论…是用于处理不精确、不完全数据的一 (1)近似分类质量
种数学方法。其基本思想是,在保持系统分类能力不变 ‘(D)=Card(P08e(D)),Card(U)
的前提下.通过知识约简,删除其中的冗余属性,导出 式中,‘(D)为根据属性c,由属性D所决定的论域u的
问题的决策规则。知识约简是粗糙集理论的重要内容之 划分的近似分类质量。ca坩(∞%(D))为根据c划分的等价
一。本文首先对粗糙集的基本概念进行了简要的概括, 类中,能够完全确定地归入根据D划分的等价类中的元
然后提出了知识的信息熵的概念,并提出了基于信息熵 素的个数。ff∞-d(U)为U中所有元素的个数。
的属性重要性的度量方法。最后,用这种方法对一实际 (2)属性c(C∈C)对决策属性D的重要性
的加工过程数据进行了知识约简,并与用经典粗集理论 匕(D)=re(D)一仁¨(D) (1)
知识约简的结果相比较,证明此方法足可行的。 艺(D)度量从原始决策表中去掉属性C后,决策分类
的变化程度.其值越大,表明它将分类改变得越多,属
1粗糙集基本概念
性c对决策属性集D的重要性越大”1。
1.1知识与不可分辨关系
粗集理论认为,知识是对对象的分类能力。我们将 2基于信息熵的粗糙集知识约简方法
所研究的对象的集合称为论域,知识即是由我们感兴趣 2.1知识的信息熵
的论域的分类模式组成的。 信息熵由于其处理不确定性问题的优势,目前已被
假设给定某对象的论域U,R--CuD为论域中的属性很多学者用来作为粗糙集研究中不确定性的度量”41。目
集合,其中c为条件属性集,D为决策属性集。对于x,Y 前的额研究存在一个问题.即如果直接利用信息熵的定
∈U,pc:R,如果满足V
P∈P:,,(z)=/,p),‘(神和‘(y)为义来反映粗糙集中的不确定性,得出的结论是知识的粗
对象x,yX}应于属性P的属性值,则称对象x,yX寸于属性
糙性越小,它的熵值反而越大,这与信息熵的物理概念
集合P是不可区分的。这种由属性集合P决定的不可分辨 是不符的。为了解决前述的第一个问题,很多学者引入
关系记为IND(P)。即: 了粗糙熵的概念”1。本文在此给出知识的信息熵的概
厨以尸)-Ux,,)EUxuI坳EP,五(砷一矗∽j 念。
1.2知识的约简 设U为一论域,R=cuD为论域中的属性集合,其中
e为u上的一个
在粗集理论中,知识的约简可以认为是从知识基中 C为条件属性集,D为决策属性集。∥e
去除一些多余的等价关系,同时维持原有的等价关系不
文档评论(0)