第8章频繁模式挖掘.pptVIP

下载本文档

59
0
约1.12万字
约 92页
2016-11-28 发布于重庆
举报

第8章频繁模式挖掘.ppt

第8章频繁模式挖掘

五邑大学信息学院　　何国辉 8.1.4 关联规则挖掘的重要算法FP-Growth（续） Han等人引入“频繁模式增长”（简称FP-增长）的概念，可以不产生候选就能够找出所有的频繁项集。韩家炜现为美国伊利诺伊大学计算机系正教授。韩教授于2003年获选美国计算机协会院士（ACM Fellow）（Citation: “For contributions in knowledge discovery and data mining”，汉译： “对知识发现和数据挖掘做出贡献”）。韩教授1978毕业于郑州大学计算机科学系，同年考入中科院研究生，1985年美国威斯康辛大学计算机系博士毕业。 8.1.4 关联规则挖掘的重要算法FP-Growth（续） FP-Growth算法的特点把数据D压缩映射到一个小而紧凑的数据结构FP-Tree，即频繁模式树中，避免了多次扫描数据库D。利用“模式分段增长”法避免产生大量的候选集。采用分而治之的方法将数据挖掘任务分解成许多小任务，从而极大地缩小了搜素空间。 8.1.4 关联规则挖掘的重要算法FP-Growth（续）【举例】使用FP-Growth算法重新对例8.4中图8.3所示的事务数据库进行关联规则挖掘，具体步骤分为：构造FP-Tree 挖掘FP-Tree 1. 构造FP-Tree 对数据库的第一次扫描与Apriori算法相同，扫描结束

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第8章频繁模式挖掘.pptVIP