2(课件)关联规则挖掘与序列模式挖掘(-Apriori--AprioriTid--AprioriHyrid---FP-Tree-AprioriAll).pptVIP

  • 79
  • 0
  • 约2.28万字
  • 约 156页
  • 2018-05-14 发布于河北
  • 举报

2(课件)关联规则挖掘与序列模式挖掘(-Apriori--AprioriTid--AprioriHyrid---FP-Tree-AprioriAll).ppt

2(课件)关联规则挖掘与序列模式挖掘(-Apriori--AprioriTid--AprioriHyrid---FP-Tree-AprioriAll)

上述算法中利用频繁序列Lk-1生成候选k-序列Ck的过程说明如下: (1)连接   对于Lk-1中任意两个序列s1和s2,如果s1与s2的前k-2项相同,即s1=e1,e2,…,ek-2,f1,s2=e1,e2,…,ek-2,f2,则合并序列s1和s2,得到候选k-序列e1,e2,…,ek-2,f1,f2和e1,e2,…,ek-2,f2,f1。即: insert into Ck select p.itemset1, p.itemset2,…, p.itemsetk-1,q.itemsetk-1 from Lk-1 p,Lk-1 q where p.itemset1=q.itemset1 and p.itemset2=q.itemset2 and …    and p.itemsetk-2=q.itemsetk-2 (2)剪枝   剪枝的原则:一个候选k-序列,如果它的(k-1)-序列有一个是非频繁的,则删除它。由Ck剪枝产生Lk的过程如下: for (所有c∈Ck的序列)   for (所有c的(k-1)-序列s) if (s不属于Lk-1) 从Ck中删除c; Ck ? Lk; //由Ck剪枝后得到Lk   【例3】以表6.6所示的序列数据库S1为例,给出ApriorAll算法的执行过程,这里I={1,2,3,4,5},每个数字表示一个项。假设min_sup=2

文档评论(0)

1亿VIP精品文档

相关文档