- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粗糙集和相关系数分析的决策规则生成
摘要 从不确定的信息表中进行决策规则的生成是重要的研究课题。Rough集(粗集)理论是一种处理不确定或模糊知识的重要工具,决策规则的相关系数分析能对决策规则的准确度和覆盖度进行描述。本文介绍基于rough集方法对决策表进行属性约简和属性值约简,去除决策表中与决策无关的冗余信息。在简化后得出决策规则中再基于规则的相关系数分析来实现决策表的规则生成。文中给出了利用分明矩阵化简决策表的算法和衡量决策规则的相关系数,通过具体实例对规则生成进行了详细说明。
关键词 Rough集;约简;核;相关系数
中图分类号:TP39 文献标识码:A
基金资助:江西省重点攻关项目(No. 20061B01002)
江西省教育厅科技计划项目(赣教技字[2007]28号)
1引言
Rough set(粗糙集)理论是一个处理含糊和不精确问题的数学工具[1],已经被广泛应用在人工智能、模式识别核新材料合成等领域[2-4]。Rough集对信息系统的约简就是考察近似空间中每个等价关系是否都是必要的,能不能在保持原有的分类能力下尽可能地去删除冗余的信息,而不影响其原有区分功能。本文首先运用rough集的方法将信息系统中的决策表进行属性及属性值约简得到决策规则,然后利用相关系数分析所得出的相关规则,并通过一个实例加以说明。
规则的相关系数
(以下介绍中s代表信息表S=(U,A,V,f))
(1)support用来表示在信息表中,满足规则ab的所有对象的数目。
supports(a,b)=card(s)
其中card 表示信息表中含有规则ab的对象的数目
(2)certainty为准确度,用来表示在规则ab中 ,若条件a为真时,规则ab为真的概率。
certaintys(a,b)= card(s)/ card(s)
其中card(s)表示满足条件a 的所有对象的数目 。
(3)coverage为覆盖度,表示规则ab中,b为真时,规则ab为真的概率。
coverage(a,b)= card(s)/ card(s)
其中card(s)表示满足结论b的所有对象的数目 。
(4)strength为规则的强度,表示在所有的规则中,规则为ab为真的概率。
strength(a,b)= card(s)/card(u)
其中card(s)表示信息系统中满足结论b的所有对象的数目 。
3基于Rough集的决策表约简
该方法是基于分明矩阵,即所有数据都是离散的。因此在进行约简以前,需要对非离散化的数据进行预处理,即数据的离散化。然后,在根据离散化后的结果移除决策表中重复的属性和对象。
属性约简一般步骤如下:
(1)写出信息系统的分明矩阵的下三角;
(2)根据分明矩阵写出分明函数;
(3)利用吸收律化简分明函数,得出最小的析取式,从中可以得到约简后的属性和属性核。
属性值一般约简步骤如下:
(1)建立分明矩阵,矩阵中只保留约简属性,填写好除对角线外的所有矩阵值;
(2)计算出每行(列)的分明函数,即可得出约简的属性值;
(3)利用约简属性值,可以得出基于决策表的决策规则。
约简具体流程图如下所示:
图1 基于Rough集的决策表的约简流程
4 应用举例
下表1是一张关于幸运色的信息表,其中性格、血型、性别、星座为条件属性,幸运色为决策属性。
表1 幸运色信息表
性格 血型 性别 星座 幸运色 数目
1 开朗 AB 男 巨蟹座 红色 60
2 内向 A 男 天蝎座 蓝色 80
3 内向 A 男 巨蟹座 白色 40
4 开朗 B 女 白羊座 红色 90
5 开朗 B 女 白羊座 白色 70
6 内向 B 女 巨蟹座 白色 60
表1中性格、血型、性别、星座、幸运色均为属性,分别记为d,b,s,c,L。现将表中的信息数字化,为此进行如下设置:(1)性格分类:开朗,内向分别数字化为1,0;(2)血型分类:A, B, AB 分别数字化0,1,2;(3)性别分类:男,女分别数字化为0,1;(4)星座分类:白羊座,巨蟹座,天蝎座分别数字化为0,1,2;(5)幸运色分类:红色,白色,蓝色分别数字化为0,1,2。
4.1 属性和属性值的约简
首先,对表2进行属性约简,其约简函数为f(x)=(dc)#160;(bc),属性d和c,或者属性b和c是其约简属性,而其核为core(a)=c。
表2 信息表的分明矩阵
1 2 3 4 5 6
1 -----
您可能关注的文档
最近下载
- 中华人民共和国电力行业标准火电机组寿命评估技术导则.PDF
- 护理团队协作与沟通技巧在临床护理中的应用.pptx VIP
- (正式版)H-Y-T 150-2013 海水中有机碳的测定 非色散红外吸收法(正式版).docx VIP
- 冀教版小升初数学模拟试卷附答案(培优).docx VIP
- 医疗废物流失、泄漏事故紧急处理流程.doc VIP
- 三视图形成及投影规律PPT课件.ppt VIP
- 八年级物理探究串并联电路电压的规律练习题3.doc VIP
- 7九江金鑫辐射报告书(报批稿6).doc VIP
- 最新《平凡的世界》阅读测试题及参考答案.docx VIP
- 工程量清单及招标控制价编制、审核入库类服务工作方案.docx VIP
文档评论(0)