基于粗糙集与相关系数研究决策规则生成.docxVIP

  • 2
  • 0
  • 约4.02千字
  • 约 9页
  • 2019-02-26 发布于广东
  • 举报

基于粗糙集与相关系数研究决策规则生成.docx

基于粗糙集与相关系数研究决策规则生成 摘要从不确定的信息表中进行决策规则的生成 是重要的研究课题。Rough集(粗集)理论是一种处理不确定 或模糊知识的重要工具,决策规则的相关系数分析能对决策 规则的准确度和覆盖度进行描述。本文介绍基于rough集方 法对决策表进行属性约简和属性值约简,去除决策表中与决 策无关的冗余信息。在简化后得出决策规则中再基于规则的 相关系数分析来实现决策表的规则生成。文中给出了利用分 明矩阵化简决策表的算法和衡量决策规则的相关系数,通过 具体实例对规则生成进行了详细说明。 关键词Rough集;约简;核;相关系数 中图分类号:TP39文献标识码:A 基金资助:江西省重点攻关项目(No. 20061B01002) 江西省教育厅科技计划项目(赣教技字:2007]28号) 1引言 Rough set (粗糙集)理论是一个处理含糊和不精确问题 的数学工具[1],已经被广泛应用在人工智能、模式识别核 新材料合成等领域[2-4] o Rough集对信息系统的约简就是考 察近似空间中每个等价关系是否都是必要的,能不能在保持 原有的分类能力下尽可能地去删除冗余的信息,而不影响其 原有区分功能。本文首先运用rough集的方法将信息系统中 的决策表进行属性及属性值约简得到决策规则,然后利用相 关系数分析所得出的相关规则,并通过一个实例加以说明。 规则的相关系数 (以下介绍中S代表信息表S二(U,A,V,f)) support用来表示在信息表中,满足规则ab的所 有对象的数目。 supports (a,b)=card (s) 其中card表示信息表中含有规则ab的对象的数目 certainty为准确度,用来表示在规则ab中,若 条件a为真时,规则ab为真的概率。 certaintys(a,b)= card(s)/ card(s) 其中card(s)表示满足条件a的所有对象的数目。 coverage为覆盖度,表示规则ab中,b为真时, 规则ab为真的概率。 coverage (a, b) = card (s) / card (s) 其中card(s)表示满足结论b的所有对象的数目。 strength为规则的强度,表示在所有的规则中, 规则为ab为真的概率。 strength(a,b)= card(s)/card(u) 其中card(s)表示信息系统中满足结论b的所有对象的 数目。 3基于Rough集的决策表约简 该方法是基于分明矩阵,即所有数据都是离散的。因此 在进行约简以前,需要对非离散化的数据进行预处理,即数 据的离散化。然后,在根据离散化后的结果移除决策表中重 复的属性和对象。 属性约简一般步骤如下: 写出信息系统的分明矩阵的下三角; 根据分明矩阵写出分明函数; 利用吸收律化简分明函数,得出最小的析取式,从 中可以得到约简后的属性和属性核。 属性值一般约简步骤如下: 建立分明矩阵,矩阵中只保留约简属性,填写好除 对角线外的所有矩阵值; 计算出每行(列)的分明函数,即可得出约简的属 性值; 利用约简属性值,可以得出基于决策表的决策规则。 约简具体流程图如下所示: 图1基于Rough集的决策表的约简流程 4应用举例 下表1是一张关于幸运色的信息表,其中性格、血型、 性别、星座为条件属性,幸运色为决策属性。 表1幸运色信息表 性格血型性别星座幸运色数目 1开朗AB男巨蟹座红色60 内向天蝎座蓝色80内向巨蟹座白色40开朗白羊座红色90开朗白羊座白色70内向巨蟹座白色60表1中性格、 内向 天蝎座 蓝色 80 内向 巨蟹座 白色 40 开朗 白羊座 红色 90 开朗 白羊座 白色 70 内向 巨蟹座 白色 60 表1中性格、 血型、性别、 星座、幸运色均为属性,分 别记为d,b,s,c,Lo现将表中的信息数字化,为此进行如下 设置:(1)性格分类:开朗,内向分别数字化为1,0; (2) 血型分类:A, B, AB分别数字化0,1,2; (3)性别分类:男, 女分别数字化为0,1; (4)星座分类:白羊座,巨蟹座,天蝎 座分别数字化为0,1,2; (5)幸运色分类:红色,白色,蓝色 分别数字化为0,1,2。 4. 1属性和属性值的约简 首先,对表2进行属性约简,其约简函数为 f (x)二(dc)#160; (be),属性d和c,或者属性b和c是其约简 属性,而其核为core (a) =co 表2信息表的分明矩阵 2 3 4 5 6 1 be c be be 5 be be 6 b be c 其次,利用约简属性b, C进行属性值约简。 最后,经过化简后,得出两套决策规则: 第一套,选择了 b, C作为其约简属性得出 (b,2)(c,l) (L,0) (b,0) (c,2) (L,2) (b,O)(c,l) (L,l) (b,

文档评论(0)

1亿VIP精品文档

相关文档