第10章 粗糙集理论 数据挖掘:概念与技术知识 1.ppt

第10章 粗糙集理论 数据挖掘:概念与技术知识 1.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10章 粗糙集理论 ;粗糙集理论是由波兰华沙理工大学Pawlak教授于20世纪80年代初提出的一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法,它是一种刻画不完整性和不确定性的数学工具,能有效地分析不精确、不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。;粗糙集在机器学习、决策支持系统、机器发现、归纳推理、数据库中的知识发现、模式识别等领域都得到了广泛的应用。 粗糙集理论逐渐应用于数据挖掘领域中,并在对大型数据库中不完整数据进行分析和学习方面取得了显著的成果,使得粗糙集理论及数据挖掘的研究成为热点领域。最近几年,粗糙集理论越来越受到众多研究人员的重视,它的应用研究得到了很大的发展。 粗糙集方法仅利用数据本身提供的信息,无须任何先验知识。;10.1 粗糙集基本概念 ;10.1.1 知识和分类 ;一个信息表 ;定义 设U≠Φ,讨论的对象组成的有限集合,称为论域(Universe),对于论域中由等价关系划分出来的任意子集,都可以称为论域U中的一个概念(concept)或范畴(category)。 为规范起见,认为空集必也是一个概念。论域U中的任意概念族称为关于论域的抽象知识,它代表了对论域中个体的分类,简称为知识。;按颜色分类: 1,3,7:红色积木 2,4:蓝色积木 5,6,8:黄色积木 按形状分类: 1,5:圆形积木 2,6:方形积木 3,4,7,8:三角形积木 按大小分类: 2,7,8:大积木 1,3,4,5,6:小积木;这些等价类是知识库K=(U,{R1,R2,R3})中的初等概念。所以: 基于R1的初等概念有: {1,3,7}:红色积木 {2,4}:蓝色积木 {5,6,8}:黄色积木 基于R2的初等概念有: {1,5}:圆形积木 {2,6}:方形积木 {3,4,7,8}:三角形积木 基于R3的初等概念有: {2,7,8}:大积木 {1,3,4,5,6}:小积木;基本概念是初等概念的交集。 基于{R1,R2}的基本概念有: {1,3,7}∩{1,5}={1}:红色圆形积木 {1,3,7}∩{3,4,7,8}={3,7}:红色三角形积木 {2,4}∩{2,6}={2}:蓝色方形积木 {2,4}∩{3,4,7,8}={4}:蓝色三角形积木 {5,6,8}∩{1,5}={5}:黄色圆形积木 {5,6,8}∩{2,6}={6}:黄色方形积木 {5,6,8}∩{3,4,7,8}={8}:黄色三角形积?? 基于{R1,R3}的基本概念有: {1,3,7}∩{2,7,8}={7}:红色大积木 {1,3,7}∩{1,3,4,5,6}={1,3}:红色小积木 {2,4}∩{2,7,8}={2}:蓝色大积木 {2,4}∩{1,3,4,5,6}={4}:蓝色小积木 {5,6,8}∩{2,7,8}={8}:黄色大积木 {5,6,8}∩{1,3,4,5,6}={5,6}:黄色小积木;2. 不可分辨关系 ;定义 设R是非空集合U上的二元系,如果它是自反的、对称的和可传递的,则称R为U上的等价关系。若 则称x与y有关系,记为 ;     若 ,则称x与y没有关系,记为 。等价关系的一个重要特点是用它可以构成U的一个划分。划分即是分类,将研究对象分成不同的类,这些类之间互不相交,且每一对象均包含在某一类中。 ;定义 设U是一个论域,R是U上的等价关系,U/R表示U上由R导出的所有等价类。  表示包含元素x∈U的R等价类。一个知识库就是一个关系系统K,其中U是论域,P是U上的一个等价类簇。如果  且   ,则   (Q的所有等价类的交也是一个等价关系)称Q为不可分辨关系,记作IND(Q)。;U/{R1,R3}={{1,3},{2},{7},{4},{5,6},{8}} U/{R2,R3}={{1,5},{2},{3,4},{7,8},{6}} U/{R1,R2,R3}={{1},{2},{3},{4},{5},{6},{7},{8}};如何求所有的等价关系的算法:;10.1.2 集合近似与粗糙概念;U;知识库的等价性;粗糙集的上近似集 (UpperApproximation)和下近似集(LowerApproximation)来近似地定义粗糙集。 粗糙集理论引入上近似和下近似等概念来刻画知识的不确定性和模糊性。;定义 设集合X? U,R是一个等价关系,并且有: U/R={y1,y2,…,yn},则: ; 设 X ={x1,x4,x6},则  R_(X)={x1,x6}  R-(X)={x1,x3,x4,x6}  BNR

文档评论(0)

youngyu0329 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档