- 79
- 0
- 约2.28万字
- 约 156页
- 2018-05-14 发布于河北
- 举报
2(课件)关联规则挖掘与序列模式挖掘(-Apriori--AprioriTid--AprioriHyrid---FP-Tree-AprioriAll)
上述算法中利用频繁序列Lk-1生成候选k-序列Ck的过程说明如下: (1)连接 对于Lk-1中任意两个序列s1和s2,如果s1与s2的前k-2项相同,即s1=e1,e2,…,ek-2,f1,s2=e1,e2,…,ek-2,f2,则合并序列s1和s2,得到候选k-序列e1,e2,…,ek-2,f1,f2和e1,e2,…,ek-2,f2,f1。即: insert into Ck select p.itemset1, p.itemset2,…, p.itemsetk-1,q.itemsetk-1 from Lk-1 p,Lk-1 q where p.itemset1=q.itemset1 and p.itemset2=q.itemset2 and … and p.itemsetk-2=q.itemsetk-2 (2)剪枝 剪枝的原则:一个候选k-序列,如果它的(k-1)-序列有一个是非频繁的,则删除它。由Ck剪枝产生Lk的过程如下: for (所有c∈Ck的序列) for (所有c的(k-1)-序列s) if (s不属于Lk-1) 从Ck中删除c; Ck ? Lk; //由Ck剪枝后得到Lk 【例3】以表6.6所示的序列数据库S1为例,给出ApriorAll算法的执行过程,这里I={1,2,3,4,5},每个数字表示一个项。假设min_sup=2
原创力文档

文档评论(0)