第8章频繁模式挖掘.pptVIP

  • 59
  • 0
  • 约1.12万字
  • 约 92页
  • 2016-11-28 发布于重庆
  • 举报
第8章频繁模式挖掘

五邑大学信息学院  何国辉 8.1.4 关联规则挖掘的重要算法FP-Growth(续) Han等人引入“频繁模式增长”(简称FP-增长)的概念,可以不产生候选就能够找出所有的频繁项集。 韩家炜现为美国伊利诺伊大学计算机系正教授。韩教授于2003年获选美国计算机协会院士(ACM Fellow)(Citation: “For contributions in knowledge discovery and data mining”, 汉译: “对知识发现和数据挖掘做出贡献”)。 韩教授1978毕业于郑州大学计算机科学系,同年考入中科院研究生,1985年美国威斯康辛大学计算机系博士毕业。 8.1.4 关联规则挖掘的重要算法FP-Growth(续) FP-Growth算法的特点 把数据D压缩映射到一个小而紧凑的数据结构FP-Tree,即频繁模式树中,避免了多次扫描数据库D。 利用“模式分段增长”法避免产生大量的候选集。 采用分而治之的方法将数据挖掘任务分解成许多小任务,从而极大地缩小了搜素空间。 8.1.4 关联规则挖掘的重要算法FP-Growth(续) 【举例】使用FP-Growth算法重新对例8.4中图8.3所示的事务数据库进行关联规则挖掘,具体步骤分为: 构造FP-Tree 挖掘FP-Tree 1. 构造FP-Tree 对数据库的第一次扫描与Apriori算法相同,扫描结束

文档评论(0)

1亿VIP精品文档

相关文档