- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 决策表属性约简
第七章 信息表属性约简
基于Rough集理论的知识获取,主要是通过对原始决策表的约简,在保持决策表决策属性和条件属性之间的依赖关系不发生变化的前提下对决策表进行约简(简化),包括属性约简和值约简。本章将对决策表的属性约简从代数集合观点和信息论的信息熵观点进行系统分析,并介绍几种有效的属性约简算法。
7.1决策表属性约简概述
一个决策表就是一个决策信息系统,表中包含了大量领域样本(实例)的信息。在第四章中,我们曾经对决策规则进行了讨论,决策表中的一个样本就代表一条基本决策规则,如果我们把所有这样的决策规则罗列出来,就可以得到一个决策规则集合,但是,这样的决策规则集合是没有什么用处的,因为其中的基本决策规则没有适应性,只是机械地记录了一个样本的情况,不能适应新的、其他的情况。为了从决策表中抽取得到适应度大的规则,我们需要对决策表进行约简,使得经过约简处理的决策表中的一个记录就代表一类具有相同规律特性的样本,这样得到的决策规则就具有较高的适应性。
根据定义2.1-1,我们可以进一步讨论决策表中属性的必要性和相应的约简算法。
定义7.1-1 设U是一个论域,P是定义在U上的一个等价关系簇,R(P。如果IND(P-{R})=IND(P),则称关系R在P中是绝对不必要的(多余的);否则,称R在P中是绝对必要的。
绝对不必要的关系在知识库中是多余的,如果将它们从知识库中去掉,不会改变该知识库的分类能力。相反,若知识库中去掉一个绝对必要的关系,则一定改变知识库的分类能力。
定义7.1-2 设U为一个论域,P为定义在U上的一个等价关系簇,R(P。如果每个关系R(P在P中都是绝对必要的,则称关系簇P是独立的;否则,称P是相互依赖的。
对于相互依赖的关系簇来说,其中包含有冗余关系,可以对其约简;而对于独立的关系簇,去掉其中任何一个关系都将破坏知识库的分类能力。
定义7.1-3 设U为一个论域,P为定义在U上的一个等价关系簇,P中所有绝对必要关系组成的集合,称为关系簇P的绝对核,记作CORE(P)。
定义7.1-4 设U为一个论域,P、Q为定义在U上的两个等价关系簇,且Q(P。
如果 (1) IND(Q)=IND(P);
(2) Q是独立的;
则称Q是P的一个绝对约简。
如果知识Q是知识P的绝对约简,那么,U中通过知识P可区分的对象,同样可以用知识Q来区分。
在讨论决策表信息系统约简的时候,一个条件属性A就对应着一个等价关系(也称不分明关系或不可分辨关系),即在条件属性A上取值的相等关系,它对论域U形成一个划分U/A。决策表的所有条件属性形成条件属性集合(P)对论域U的划分U/P,同时,决策属性集D={d}也对论域形成一个划分U/D。这两个划分形成了条件属性和决策属性在对论域样本分类上的知识。属性约简的目标就是要从条件属性集合中发现部分必要的条件属性,使得根据这部分条件属性形成的相对于决策属性的分类和所有条件属性所形成的相对于决策属性的分类一致,即和所有条件属性相对于决策属性D有相同的分类能力。这就是相对约简的概念。
定义7.1-5 设U为一个论域,P、Q为定义在U上的两个等价关系簇,Q的P正域记为POSP(Q),定义为:
。
定义7.1-6 设U为一个论域,P、Q为定义在U上的两个等价关系簇,若POSP(Q)=POS(P-{r})(Q),则称r为P中相对于Q可省略的(不必要的),简称P中Q可省略的;否则,称r为P中相对于Q不可省略的(必要的)。
定义7.1-7 设U为一个论域,P、Q为定义在U上的两个等价关系簇,若P中的每一r都是P中Q不可省略的,则称P为(相对于)Q独立的。
定义7.1-8 设U为一个论域,P、Q为定义在U上的两个等价关系簇,若P的Q独立子集S(S(P)有POSs(Q)=POSP(Q),则称S为P的Q约简。
可以记P的所有Q约简关系簇为REDQ(P)。
定义7.1-9 设U为一个论域,P、Q为定义在U上的两个等价关系簇,P的所有Q不可省略原始关系簇称为P的Q核,记为COREQ(P)。
定义7.1-10 设U为一个论域,P、Q为定义在U上的两个等价关系簇,如果POSP(Q)=U,则称论域U是P上相对于Q一致的。
定理7.1-1 设U为一个论域,P、Q为定义在U上的两个等价关系簇,REDQ(P)为P的所有Q约简关系簇,COREQ(P)为P的Q核,则COREQ(P)=(REDQ(P)。
下面再给出在可变精度Rough集模型相应的属性集之间依赖、独立,以及约简的定义(定义7.1-11至定义7.1-13)。
定义7.1-11 如果,则称属性a是属性集C中相对于决策属性D是依赖的;否则称属性a是属性集C中相对于决策属性D是独立的。
定义7.1-12 如果存在条件属性集B(B(C)的真子集E,使得,则称B相对于决策属性D是依赖的;否则,
您可能关注的文档
- 桌面管理器的几点应用.pptx
- 2013海淀区初二期末备战的几点说明!来自区教研.ppt
- Travel journal旅行日记.ppt
- 课堂活动:九格时光.ppt
- 会计专业毕业答辩课件.ppt
- 2.3家长会.pptx
- 雷锋ppt..ppt
- 团员日记 11、9.pptx
- 三年级上册百花园二习作《观察日记:写一种喜欢的动物》(夏).ppt
- 日本古代随笔文学鉴赏.ppt
- 自考专业(公共关系)检测卷附完整答案详解【各地真题】.docx
- 自考专业(公共关系)检测卷及答案详解【全国通用】.docx
- 自考专业(公共关系)检测卷及答案详解参考.docx
- 自考专业(公共关系)检测卷及一套参考答案详解.docx
- 自考专业(公共关系)常考点试卷附完整答案详解(网校专用).docx
- 自考专业(公共关系)常考点试卷带答案详解(模拟题).docx
- 自考专业(公共关系)检测卷及参考答案详解【模拟题】.docx
- 自考专业(公共关系)常考点试卷(名师推荐)附答案详解.docx
- 自考专业(公共关系)常考点试卷(名师推荐)附答案详解.docx
- 自考专业(公共关系)检测卷【完整版】附答案详解.docx
文档评论(0)