6.挖掘频繁模式、关联和相关性试卷.pptVIP

  • 10
  • 0
  • 约8.17千字
  • 约 47页
  • 2017-06-24 发布于湖北
  • 举报
从数据库构建一个FP树 {}null f:4 c:1 b:1 p:1 b:1 c:3 a:3 b:1 m:2 p:2 m:1 项头表 Item frequency head f 4 c 4 a 3 b 3 m 3 p 3 min_sup= 3 TID Items bought (ordered) frequent items 100 {f, a, c, d, g, i, m, p} {f, c, a, m, p} 200 {a, b, c, f, l, m, o} {f, c, a, b, m} 300 {b, f, h, j, o} {f, b} 400 {b, c, k, s, p} {c, b, p} 500 {a, f, c, e, l, p, m, n} {f, c, a, m, p} 步骤: 扫描一次数据库,导出频繁项的集合(1-项集) 将频繁项按降序排列 再次扫描数据库,构建FP树 FP树的构建(第二次扫描数据库) 创建树的根节点,用null标记; 将每个事务中的项按递减支持度计数排列,并对每个事务创建一个分枝; 比如为第一个事务{f, c, a, m, p}构建一个分枝 当为一个事务考虑增加分枝时,沿共同前缀上的每个节点的计数加1,为跟随前缀后的项创建节点并连接 比如将第二个事务{f, c, a, b, m}加到树上时,将为f,

文档评论(0)

1亿VIP精品文档

相关文档