基于Eclat算法的海量数据库..docVIP

  • 48
  • 0
  • 约4.88万字
  • 约 65页
  • 2017-01-28 发布于重庆
  • 举报
基于Eclat算法的海量数据库.

摘 要 数据挖掘一般是指从大量的数据中通过算法发现隐藏于其中信息的过程。关联规则是数据挖掘的重要研究及应用领域,近几年,许多学者对关联规则挖掘做了大量的研究,关联规则主要用于发现数据库中不同属性或者不同数据项之间的关联关系。随着“大数据”时代的到来,人们也越来越关注对关联规则的研究。本文在前人的基础上,进行了一些关于提高关联规则挖掘算法性能和功能完善的研究工作。 本文首先总结了关联规则挖掘算法的研究成果,分析了AIS、Apriori、FP-Growth等算法的实现方式以及特点,通过对经典算法的分析为提出性能更优、更易实现的挖掘算法做好理论方面的准备。本文提出基于数据垂直分布的深度优先关联规则挖掘算法DS-Eclat(Directed Segmenting-Eclat),采用关联矩阵描述数据项间的关联关系,并利用关联矩阵约束候选项集的产生;同时,采用深度优先的挖掘模式,提高生成K-频繁项集的效率。该算法另一个创新点在于对数据进行有向分割,并通过连接得到最大频繁项集。该算法利用布尔矩阵存储频繁项集支持集,减小了内存开销,而且改进算法不需要对数据库进行多次扫描,大幅降低了系统I/O的负载,同时也减少了候选项集的产生。 依据关联规则,实现了DS-Eclat算法在图书馆管理系统中的应用。对各类图书之间的关联规则进行挖掘,实验结果表明各类图书之间具有关联性,并得出五类(即C、I、O、P及T)具

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档