粗糙集与数据挖掘简介.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
粗糙集与数据挖掘简介

粗糙集和数据挖掘简介- ????????????粗糙集理论[Rough set theory]是1982年由波兰数学家 Z.Pawlak[2]提出的,由于最初关于粗糙集理论的研究大都是用波兰语发表的,因此当时没有引起国际计算机学界和数学界的重视,研究仅限于东欧的一些国家,直到20世纪80年代末才逐渐引起各国学者的注意。 1991年,Pawlak [2]发表了专著《Rough Set:Theoretical Aspacts of Reasoning about Data》,奠定了粗糙集理论的基础,从而掀起了粗糙集的研究热潮。1992年,在波兰召开了第一届国际粗糙集研讨会,这次会议着重讨论了集合近似的基本思想及其应用,其中粗糙环境下的机器学习的基础研究是这次会议的四个专题之一。1993年在加拿大召开了第二届国际粗糙集与知识发现研讨会,这次会议积极推动了国际上对粗糙集应用的研究。由于这次会议正值知识发现成为热门研究话题,一些著名的知识发现学者参加了这次会议,并且介绍了许多应用扩展粗糙集理论的数据挖掘的方法与系统。1996年在日本东京召开了第五届国际粗糙集研讨会以及2001年在我国举行的研讨会推动了亚洲地区和我国对粗糙集理论与应用的研究。现在,美国、加拿大、波兰、日本都有粗糙集研究的专门机构。 粗糙集首先从新的视角对知识进行了定义。把知识看作是关于论域的划分,从而认为知识是具有粒度〔granularity〕的。认为知识的不精确性是由知识粒度太大引起的。为处理数据〔特别是带噪声、不精确或不完全数据〕分类问题提供了一套严密的数学工具,使得对知识能够进行严密的分析和操作。又由于数据挖掘的深入研究和一些成功的商业运作,使得粗糙集理论和数据挖掘有了天然的联系,粗糙集在知识上的定义、属性约简、规则提取等理论,使得数据库上的数据挖掘有了深刻理论基础,从而为数据挖掘提供了一种崭新的工具。粗糙集不仅自己可以独特的挖掘知识,而且可以和其他的数据挖掘算法结合起来,从而产生了学多混合数据挖掘算法,大大开拓了数据挖掘的算法和技术,丰富了数据挖掘的工具。 除了研究,人们也在积极寻找粗糙集在数据挖掘中的应用,如RSES[18]系统,该系统是基于粗糙集理论上研制的数据挖掘系统,里面提供了粗糙集的属性约简算法和规则提取,可以找到最佳约简集和近似约简集,并可以提出规则。另外,还有,Regina大学开发的KDD-R系统[3],被广泛用于医疗诊断、电信业等领域。还有美国Kansas大学开发的LERS(Learning from Examples based on RS)系统,在医疗诊断、社区规划、全球气象研究等方面都有应用。 粗糙集目前研究得到了很大的发展,主要方向如下。 1.粗糙集的属性约简。约简是粗糙集用于数据分析上的重要方面,但是求最小约简是NP问题,大都采用启发式算法。⑴、重要性方法:根据重要性来对属性进行约简。⑵、根据布尔运算,此方法可以求出所有最小约简,但是只适合小数据集。⑶遗传算法:Bjorvand 和Kormoraski用遗传算法来求最小约简。 2.粗糙模型的扩展。粗糙集理论用于数据挖掘时会碰到噪音数据、数据缺失、大数据量的一系列经典模型处理不理想的情况,于是出现了扩展的模型。 ⑴可变精度模型:有一定容错能力,在一定情况下退化为经典模型。⑵相似模型:可以处理数据库中的缺失值。 3.粗糙逻辑。在RS的基础上建立rough逻辑。 4.多方法的融合。⑴粗糙集和神经网络的结合,加快神经网络的速度。⑵和遗传算法的结合来处理大数据集。 总之,。粗粮集理论的应用前景很广阔,不但可以用于构造新型的系统,而且关键在于它能够优化现有的许多算法。大数据集、高效约简算法、并行计算以及混合算法研究等问题仍是粗糙集在数据挖掘中需要探讨的问题。

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档