- 59
- 0
- 约1.12万字
- 约 92页
- 2016-11-28 发布于重庆
- 举报
第8章频繁模式挖掘
五邑大学信息学院 何国辉 8.1.4 关联规则挖掘的重要算法FP-Growth(续) Han等人引入“频繁模式增长”(简称FP-增长)的概念,可以不产生候选就能够找出所有的频繁项集。 韩家炜现为美国伊利诺伊大学计算机系正教授。韩教授于2003年获选美国计算机协会院士(ACM Fellow)(Citation: “For contributions in knowledge discovery and data mining”, 汉译: “对知识发现和数据挖掘做出贡献”)。 韩教授1978毕业于郑州大学计算机科学系,同年考入中科院研究生,1985年美国威斯康辛大学计算机系博士毕业。 8.1.4 关联规则挖掘的重要算法FP-Growth(续) FP-Growth算法的特点 把数据D压缩映射到一个小而紧凑的数据结构FP-Tree,即频繁模式树中,避免了多次扫描数据库D。 利用“模式分段增长”法避免产生大量的候选集。 采用分而治之的方法将数据挖掘任务分解成许多小任务,从而极大地缩小了搜素空间。 8.1.4 关联规则挖掘的重要算法FP-Growth(续) 【举例】使用FP-Growth算法重新对例8.4中图8.3所示的事务数据库进行关联规则挖掘,具体步骤分为: 构造FP-Tree 挖掘FP-Tree 1. 构造FP-Tree 对数据库的第一次扫描与Apriori算法相同,扫描结束
您可能关注的文档
最近下载
- 试验设计概论(jmp).ppt VIP
- 新生物医药产业中的生物信息学研究与应用.pptx VIP
- 2025年云南省大理州大理市招聘工会社会工作者11人笔试题库及答案详解(网校专用).doc VIP
- 大英县工业污水处理厂二期及配套管网建设项目环评报告.pdf VIP
- 2026压力管道知识题库(GC工业管道).pdf VIP
- 2024届广东省深圳市高三一模数学试卷(含答案).pdf VIP
- 2026新疆北屯经开投资发展有限公司人员招聘3人备考题库及完整答案详解.docx VIP
- 生物医学新技术临床研究和临床转化应用管理条例.ppt
- 2025年事业单位招聘考试(林业基础知识)历年参考题库含答案详解.docx VIP
- 《选才、用才、育才、留才》.ppt VIP
原创力文档

文档评论(0)