基于多数据库系统的多层关联规则挖掘技术研究和实现-计算机应用专业论文.docxVIP

基于多数据库系统的多层关联规则挖掘技术研究和实现-计算机应用专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多数据库系统的多层关联规则挖掘技术研究和实现摘 基于多数据库系统的多层关联规则挖掘技术研究和实现 摘 要 随着计算机技术的飞速发展和信息时代的到来,在网络分布式环境下,如何 进行有效的数据挖掘已成为数据库研究领域一个新的课题。关联规则挖掘是数据 挖掘研究的一个重要方面。本文主要从多事务同构数据库系统的角度出发,针对 多层关联规则挖掘的理论和方法进行了深入研究,提出若干解决方法和算法。具 体研究内容如下: 1)分析现有概念树的生成和表示方法,结合网络多数库环境下数据分布的 特性,采用由局部概念树合并成全局概念树方法,用XML语言对概念树描述并 进行网间传输,用以减少通讯量。由此可以从动态调整后的概念树中,提取出指 导跨层挖掘的信息。 21针对网络多事务数据库系统提出一种基于FP-Tree的多层关联规则挖掘算 法ML DFPT。ML DFPT最多只需扫描数据库三遍,且不用产生大量的候选项 集,可有效减少了通讯量,从而提高规则挖掘的有效性。并通过对ML_DFPT算 法进行部分修改,使算法可根据跨层挖掘信息在特定的层间挖掘出层间关联规 则。 3)通过对现有规则表示法和规则本身的分析,提出一种树型关联规则的表示 法,使用户可以分层、分类浏览规则,并可降低冗余性、提高可读性。 以上提出的算法和解决方案己通过原型系统的实验,结果证明ML DFPT算 法和相关技术是有效的、可行的。 关键词:数据挖掘,概念树,XML,多层关联规则,多事务数据库系统,频繁模 式树. 基于多数据库系统的多层关联规则挖掘技术研究和实现Abstract 基于多数据库系统的多层关联规则挖掘技术研究和实现 Abstract Wkh the coming of rapid development of computer technology and information era,how to mine efficient knowledge from under distributed environment becomes a new topic in database research areas.Association rule mining is an important task of data mining.In this thesis,we focus on research on distributed mining multiple level associations rules,and propose several solutions and efficient distribute algorithms. The following iS our main research WOrks: 1)we first analyze the present generation and specification of conceptual hierarchies and consider the characters of distributed environment.Then in this paper we generate the global conceptual hierarchy by merging the local conceptual hierarchies,use XML to specify and translate the conceptual hierarchies,and get the CROSS level mining information from dynamic adjusted global conceptual hierarchy. 2)we introduce algorithm ML_DFPT(Multiple Level Distribute Frequent Pattern Tree)for distribute mining of frequent pattems,based on FP—growth mining,that uses only three full I/O scans of the database,eliminating the need for generating the candidate items,and reducing the communication cost.By modifying,the algorithm ML—DFPT Can also distribute mine of CROSS level association rules using cross level mining information. 3)B

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档