关联规则中Apriori算法创新研究.docVIP

  • 5
  • 0
  • 约3.6千字
  • 约 7页
  • 2018-08-21 发布于福建
  • 举报
关联规则中Apriori算法创新研究

关联规则中Apriori算法创新研究   摘要:在关联规则理论的基础上,通过对现有算法的效率分析,在原有Apriori关联规则挖掘算法的基础上,从减少事务数据库中扫描记录量入手,提出一个改进的快速关联规则挖掘算法Fast_Apriori。利用候选项集和频繁项集中的结果对数据库中的记录进行筛选,对不包含候选项集中任何项集的记录和不包含在候选项集中的事物记录直接删除,减少扫描的记录数,提高整个算法的效率。   关键词:关联规则 Apriori算法 候选项集 频繁项集   中图分类号:TP311.13 文献标识码:A 文章编号:1007-9416(2014)04-0133-02   在关联规则的各种挖掘算法研究中,主要集中在产生频繁项集的这一挖掘步骤。在众多算法中,Apriori算法最为著名,它是Agrawal等人在1994年提出的,该算法首次将关联规则挖掘理论运用在现实应用系统中。Apriori算法使用了一种逐层迭代的宽度优先搜索策略,由满足一定频度的项集来构造可能是下一个满足频度的项集的候选项集,根据设定的最小支持度计数筛选出频繁项集。   Apriori算法基本思想就是发现频繁项集,然后找出频繁项集中的关联性更强的规则。找到频繁项集的方法是先找出所有可能是频繁项集的候选项集。最简单的方法是穷举法,把所有的项集都作为候选项集,然后对它在事务数据库中出现的次数计数,计数满足

文档评论(0)

1亿VIP精品文档

相关文档