分布式动态数据库增量关联规则挖掘的研究.docVIP

下载本文档

6
0
约6.6千字
约 14页
2018-10-13 发布于福建
举报

分布式动态数据库增量关联规则挖掘的研究.doc

分布式动态数据库增量关联规则挖掘的研究

分布式动态数据库增量关联规则挖掘的研究　　摘要：为了解决分布式动态数据库关联规则挖掘效率低的问题，利用MPI与OpenMP的优点，提出了实现增量关联规则挖掘的混合模式。在次频繁项概念基础上，给出该混合模式总体架构，设计了基于MPI与OpenMP的分布式动态数据库增量关联规则挖掘混合模式工作流程，并给出了伪代码描述，该模式只处理变化的数据。实验结果表明，该模式比现有的串行与分布式关联规则挖掘方法效率更高、性能更优。　　关键词：关联规则；分布式数据库；动态数据　　DOIDOI：10.11907/rjdk.171746 　　中图分类号：TP391文献标识码：A文章编号2017）010016604 　　0引言　　关联规则是一种能够从数据库海量数据中发现知识的重要方法[1，2]。大多数关联规则挖掘算法以静态数据库为前提，但实际上许多数据库是动态的，因此有必要研究动态数据库的关联规则挖掘[35]。有学者提出了增量关联规则挖掘方法，如CHEUNG提出基于次频繁项的快速更新算法FUP，这种算法在处理数据更新方面仍然很慢。现今大多数计算机有多个内核，大多数单位内部是通过局域网互联，具有多个节点，因此，串行算法不能有效利用当前的硬件资源。为了应对大数据的出现与更新，串行关联规则算法可扩展性问题亟待解决。有学者提出了并行或分布式关联规则法，但在时间执行上依然存在

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

分布式动态数据库增量关联规则挖掘的研究.docVIP