粗糙集理论及发展现状研究.docVIP

下载本文档

9
0
约3.94千字
约 7页
2016-10-07 发布于北京
举报
版权申诉

粗糙集理论及发展现状研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

粗糙集理论及发展现状研究.doc

粗糙集理论及发展现状研究　　摘要粗糙集理论是一种新颖、有效的软计算方法，是分析和处理不完备信息的一种数学工具。本文介绍了粗糙集理论的基本概念和发展历程，阐述了粗糙集理论的应用领域。　　关键词粗糙集模糊集神经网络　　中图分类号：O24 文献标识码：A 　　0 引言　　随着大规模数据库的广泛使用和因特网的迅猛发展，庞大的信息量已渗透到社会生活和生产的各个领域。由于人的参与以及自然语言中存在的模糊性和歧义性使得数据与信息不够准确，甚至不完整。如何处理这些模糊的、不确定的、不完整的大量信息，从中获取潜在的、正确的、有利用价值的知识？　　粗糙集（Rough Set）理论是一种刻画不完整性和不确定性的数学工具，能有效分析和处理不精确、不一致和不完整等各种不完备信息，并从中发现隐含的知识，揭示潜在的规律。它对人工智能和认知科学非常重要，且为数据挖掘、机器学习、决策分析和支持系统、模式识别、粒度计算、近似推理等领域的信息处理提供了很有效的理论框架。　　1 粗糙集理论基础　　1.1 与知识相关的定义　　定义1 知识库：假设R是在论域U基础上的一个等价关系，那么，U/R则表示为该论域U上R的等价类构成的集合，所以，一个关系系统K = （U，R）就是一个知识库。并且，一个知识库对应着一个划分。通常情况下，我们用等价关系来代替分类，因此，知识库代表了对论域U的一种分类能力。　　定义2 不可分辨关系：如果P?H誖且P≠Q，那么∩P（P中全部等价关系的交集）也是一种等价关系，称其为P上的不可分辨关系，记为（P），此时U/（P），表示成ind（P）上的等价关系簇P的等价类构成的集合，即与P相关的知识。　　1.2 上、下近似集、正域、负域、边界域　　定义3 上近似集、下近似集：给定知识库K = （U，S），S表示论域U上的等价关系簇，则?HOX?H誙和论域U上的一个等价关系R∈IND（K），定义子集X关于知识R的上近似集和下近似集分别为：　　上近似：（X） = {∈U：[]R∩X≠?HT} 　　下近似：（X） = {∈U：[]R?H誜} 　　定义4 正域、负域和边界域：（X） = （X）称为X的R正域。表示论域U中R的某个或某些划分完全属于X。（X） = U（X）称为X的R负域，表示根据知识R，肯定不属于集合X的U中元素组成的集合。上近似和下近似的差（X） = （X）（X）称为X的R边界域，表示根据知识R，不能肯定属于集合X也不能肯定属于集合一X的U中元素组成的集合。由此可知，集合的不确定性是由边界域引起的。　　1.3 信息系统　　定义5 信息系统：四元组IS = （U，C，V，）是一个信息系统，其中U = {，，…}，为对象的非空有限集合，即论域； = {∣∈C}为属性的非空有限集合，每个∈C（1≤≤）称为C的一个简单属性；V = ∪表示信息函数的值域，为属性的值域； = {∣：U→}表示IS的信息函数，为属性的信息函数。　　当?HO∈C，?HO∈U，（）没有缺省值时，我们称信息系统是完备的，否则是不完备的。如果在知识系统KRS中，令A = C∪D（C∩D = ?HT），其中C称为条件属性集，D称为决策属性集。若D = ?HT，则知识表达系统就是一个信息系统（信息表）；若D ≠ ?HT，则称知识表达系统是一个决策表。　　2 粗糙集理论的背景及应用　　粗糙集理论是波兰科学家Z· Pawlak于1982年提出的一种关于数据分析和推理的理论。1991年Z·Pawlak出版了第一本关于粗糙集的专著《Rough set：theoretical aspects of reasoning about data》，成为粗糙集理论研究的第一个里程碑。1993年在加拿大召开第二届国际粗糙集理论与知识发现研讨会，由于当时正值数据库知识发现（KDD）成为研究的热门话题，一些著名KDD学者参加了这次会议，介绍了许多应用扩展粗糙集理论的知识发现方法与系统。我国对粗糙集理论的研究起步较晚，始于20世纪90年代初期。王珏等人在将粗糙集理论引入作出了重要贡献。2001年5月在重庆举行了第一届中国粗糙集理论与软计算学术研讨会（CRSSC）。　　粗糙集理论与模式识别、机器学习、数据库等理论相结合，开发了多个原型系统，其中有代表性的有Rosetta系统、KDD-R系统、LERS系统等。粗糙集应用在许多方面。　　2.1 连续属性的离散化　　一般来说，数据库中的属性可以分为两种类型：一种是连续（也称定量）属性，表示对象的某些可测性质，其取值自某个连续区间，如温度等；另一种是离散（定性）属性，这种属性值使用语言或少量离散值来表述，如性别等。在大多数情况下，同一个数据库中既包含连续属性，也包含离