关联规则算法综述 2.docVIP

  • 7
  • 0
  • 约2.23千字
  • 约 4页
  • 2018-12-19 发布于贵州
  • 举报
关联规则算法综述 2

关联规则算法综述 2 关联规则算法综述(2)2010-04-29 22:474算法综述 4.1经典的频集算法 Agrawal等于1994年提出了一个挖掘顾客交易数据库中项集间的关联规则的重要方法,其核 心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。 所有支持度大于最小支持度的项集称为频繁项集,简称频集。 4.1.1算法的基本思想 首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产 生强关联规则,这些规则必须满足最小支持度和最小可信度。 挖掘关联规则的总体性能由第一步决定,第二步相对容易实现。 4.1.2 Apriori核心算法分析 为了生成所有频集,使用了递推的方法。其核心思想简要描述如下: (1)L1={large 1-itemsets}; (2)for(k=2;Lk-1F;k++)do begin (3)Ck=apriori-gen(Lk-1);//新的候选集 (4)for all transactions tD do begin (5)Ct=subset(Ck,t);//事务t中包含的候选集 (6)for all candidates cCt do (7)c.count++; (8)end (9)Lk={c Ck|c.countminsup} (10)end (11)Answer=∪kLk; 首先产生频繁1

文档评论(0)

1亿VIP精品文档

相关文档