基于粗糙集理论的数据挖掘算法分析-管理科学与工程专业论文.docxVIP

基于粗糙集理论的数据挖掘算法分析-管理科学与工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 摘 要 进入网络信息时代,随着计算机技术和网络技术的飞速发展,使得各个行业 领域的信息急剧增加,如何从大量的、杂乱无章的数据中发现潜在的、有价值的、 简洁的知识呢?数据挖掘(DM)和知识发现(KDD)技术应运而生。粗糙集理论与方 法作为数据挖掘或者知识发现方法的一种,它与基于概率论的数据挖掘方法、基 于模糊理论的数据挖掘方法和基于证据理论的数据挖掘方法等其他处理不确定 性问题理论的方法最显著的区别是它不需要提供问题所需处理的数据集之外的 任何先验知识,而且与处理其他不确定性问题的理论有很强的互补性,特别是模 糊理论。 但是,粗糙集理论的基本运算是建立在求集合的并交补和求等价关系基础之 上的,利用粗糙集理论挖掘一般决策表的最简规则或者所有规则是一个 NP—Hard问题,NP_—Hard问题是计算数学的一个普遍难题,它的解决依赖于某 个NP—Hard问题的解决,因此,如何降低算法的复杂度成为限制粗糙集理论应 用的一个根本性问题。 本文介绍了粗糙集理论的基本概念和扩展的粗糙集理论模型,研究了粗糙集 理论进行数据挖掘算法的特点,通过证明一个半群一有限集合代数系统的可表示 定理,将有限集合代数系统用一个与之同构的位向量代数系统来描述,将集合的 并交补运算转化为位向量代数系统的与或非运算,该定理具有一定的普适性一基 本上所有的基于粗糙集理论的各种算法都可以适用。在该定理的基础上,设计了 一种基于粗糙集论的数据挖掘属性约简算法和规则挖掘算法,与一般的算法比 较,时间复杂度大大降低;空间的复杂度降为一般算法的八分之一。利用该算法 开发了一个原型系统RSDM和一个MATLAB仿真软件包,以进行数据挖掘的进 一步研究和应用。 另一方面,粗糙挖掘算法的时间复杂度问题并没有得到完全的解决,因此本 文介绍了基于消息传递的并行计算模型,在此模型基础上,利用MPICH并行计 算软件包,初步研究了粗糙挖掘的并行计算算法。 现将本文的主要工作列举如下: 1.给出并证明有限集合代数系统可表示定理,设计基于粗糙集理论的数据 挖掘(以下简称粗糙挖掘1串行实现算法。 2.介绍了一般知识发现过程,研究了粗糙挖掘的过程,设计开发了粗糙挖 掘的原型系统RSDM和一个MATLAB粗糙挖掘软件包。 3.研究了基于Windows2000集群式系统上,采用消息传递的并行计算模型, 利用MPI初步研究了基于粗糙理论的数据挖掘并行实现算法。 关键词:粗糙集,Rough Set,数据挖掘,MPI AbstractNow,we Abstract Now,we are stepping in an era of net information,With the high—speed development of computer technology and net technology,the information in different fields has increased extremely.How to pick up the potential,valuable and compact knowledge from the vast and disordered data has become a desiderative problem?The technologies of data mining(DM)and knowledge database discovery(KDD)have emerged witll such needs. The rough set theory is used as approach of DM KDD.The distinct difference of the rough set approach compared with other approaches of dealing wim the uncertain problem such as the data mining approach based on probability,the data mining approach based fuzzy theory and the dataⅡlilling approach based proof theory is that the method need not provide any known knowledge which is out of the approaching data set domains。The rough set method is worked all stronger auxiliary function、加Ⅱ1 the other methods ofdealing with un

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档