- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不完备信息系统的Ro的ugh集扩充方法
不完备信息系统的Rough集扩充方法
摘 要 本文就目前Rough集直接处理不完备信息系统的Rough集模型进行讨论、归纳与总结,有利于对不完备信息系统的Rough集扩充方法的认识,对在不完备信息系统下拓展Rough集有所启示和参考。 关键词 不完备信息系统; Rough集;模型拓展1 引言 由Pawlak等人在20世纪80年代提出的经典Rough集理论在知识获取方面取得了很大的成功。但遗憾的是在传统的Rough集理论中,存在一个明显的假设,即所有可以获得的个体对象由这个属性集合给出完全描述。换句话说,用 表示个体对象集合, 表示属性集合,则对于任意 , ,属性值 总是存在的,即 。这个假设虽然是合理的,但是与很多现实情况有差异。在这些情况下,由于不可能得到一部分属性值,或者有些对象的某个属性值是肯定不可能得到的,这导致关于对象集合U 的描述是不完全的。因此,就导致了不完备信息系统的出现。然而,对不完备信息的理解存在两种语义解释,遗漏(missing)语意和缺席(absent)语意。遗漏语意下,认为遗漏值(或空值)将来是可以得到的并且可以与任意值相比较;而缺席语意下,认为缺席值(或空值)是无法再得到的,不能与任意值相比较。 为了使Rough集理论能适应于对不完备信息系统的处理,目前主要有两类方法。一是间接处理方法,这种方法有两种情形:第一种情形是删去带有缺失值的实例,但是将会丢失数据中很多有用的知识;第二种情形是通过一定的方法(通常是基于概率统计)把不完备信息系统转化为完备信息系统,即数据补齐,但是,补齐处理只是将未知值补以我们的主观估计值,或多或少改变了原始的信息系统,因此不一定完全符合客观事实。二是直接处理方法:其特点是对经典Rough集理论中相关概念在不完备信息系统下进行适当扩充。本文就直接处理方法目前的情况进行阐述与总结,有利于对不完备信息系统的Rough集扩充方法的认识,对在不完备信息系统下拓展Rough集有所帮助和参考。2 不完备信息系统的扩充方法2.1 容差关系 基于遗漏(missing)语意,Kryszkiewicz给出了容差关系的定义。给定信息系统 ,其中 是条件属性集合,d 是决策属性,对于具有空值的属性子集 ,记空值为“*”, ,容差关系 T 定义如下: 定义2.1.1 容差关系 T 定义为: 显然,T 是自反且对称的,但不传递。进一步,用符号 表示在属性集合 B 上满足关系 T(x,y) 的个体对象y的集合,即对象x 的容差类。根据定义2.1.1得到上、下近似的定义: 定义2.1.2 不完备信息表 中对象集合X 关于属性集 的上近似 和下近似 分别定义为: , 。 容差关系是目前面向不完备信息系统中应用最为广泛的一种Rough集扩充模型,它将缺失值的可能范围最大化,从而保证了后续算法可以挖掘到尽可能多的知识。但这种最大化的前提假设也同时增加了后续算法的难度和复杂度,在数据量较大,缺失值较多的情况下难以应用。2.2 非对称相似关系 Stefanowski和Tsoukias认为空值不是不确定的,而是当前不存在的,从而不允许比较空值,即缺席(absent)语意。基于这种观点他们给出非对称相似关系如下: 定义2.2.1 给定信息系统 ,其中 是条件属性集合,d 是决策属性,对于具有空值的属性子集 ,记空值为“?”, ,非对称相似关系S 的定义为: 显然,S 是自反且传递的,但不对称。实际上,非对称相似关系可以认为是包含关系的一个代表,因为只要x 的描述包含在 y 的描述中,就认为 x 与 y 相似。对于任意对象 ,可以定义两个非对称相似集合: 定义2.2.2 非对称相似于 的x 对象集合 J(x) ,x 与之非对称相似的对象集合 的定义为:,。 一般地, 。因此, 定义2.2.3 不完备信息表 中对象集合 X 关于属性集 的上近似 和下近似 分别定义为: , 。 这种关系乍看起来似乎有点奇怪,但我们总是认为孩子象父母,复制品象真品,反过来人们难于接受。如果系统环境如此,非对称相似关系是合理的。2.3 量化容差关系 为了进一步刻画容差关系和非对称相似关系中两个实例之间的“相似”程度Stefanowski和Tsoukias在研究了容差关系和非对称相似关系后提出了量化容差关系。人们可以用不同的比较规则来定义不同的量化容差关系。给定一个量化容差关系,对于个体对象全集U中的每个元素,Stefanowski和Tsoukias定义了“容差类”概念。容差类是一个用关于参考元素的“容差度”作为成员函数的模糊集。如果容差度的值为1,量化容差关系就变成容差关系。事实上,容差关系是量化容差关系的特殊情形。在Stefanowski和Tsoukias提出的量化容差关系中,需要预先知道信息系统中属性值的概率分布情况,这对于一个新的不完备
文档评论(0)