分布式动态数据库增量关联规则挖掘的研究.docVIP

  • 6
  • 0
  • 约6.6千字
  • 约 14页
  • 2018-10-13 发布于福建
  • 举报

分布式动态数据库增量关联规则挖掘的研究.doc

分布式动态数据库增量关联规则挖掘的研究

分布式动态数据库增量关联规则挖掘的研究   摘要:为了解决分布式动态数据库关联规则挖掘效率低的问题,利用MPI与OpenMP的优点,提出了实现增量关联规则挖掘的混合模式。在次频繁项概念基础上,给出该混合模式总体架构,设计了基于MPI与OpenMP的分布式动态数据库增量关联规则挖掘混合模式工作流程,并给出了伪代码描述,该模式只处理变化的数据。实验结果表明,该模式比现有的串行与分布式关联规则挖掘方法效率更高、性能更优。   关键词:关联规则;分布式数据库;动态数据   DOIDOI:10.11907/rjdk.171746   中图分类号:TP391文献标识码:A文章编号2017)010016604   0引言   关联规则是一种能够从数据库海量数据中发现知识的重要方法[1,2]。大多数关联规则挖掘算法以静态数据库为前提,但实际上许多数据库是动态的,因此有必要研究动态数据库的关联规则挖掘[35]。有学者提出了增量关联规则挖掘方法,如CHEUNG提出基于次频繁项的快速更新算法FUP,这种算法在处理数据更新方面仍然很慢。现今大多数计算机有多个内核,大多数单位内部是通过局域网互联,具有多个节点,因此,串行算法不能有效利用当前的硬件资源。为了应对大数据的出现与更新,串行关联规则算法可扩展性问题亟待解决。有学者提出了并行或分布式关联规则法,但在时间执行上依然存在

文档评论(0)

1亿VIP精品文档

相关文档