数据挖掘——第三章关联规则挖掘(二).pptVIP

  • 193
  • 0
  • 约1.39万字
  • 约 72页
  • 2018-09-04 发布于河北
  • 举报

数据挖掘——第三章关联规则挖掘(二).ppt

数据挖掘——第三章关联规则挖掘(二)

1.2.1Apriori算法举例 已知事务数据库D如表10.1所示,最小支持度计数为2,即 minsupport=2/9, 利用Apriori算法挖掘所有满足minsup的频繁集。 (1)第一次扫描,扫描数据库获得每个候选项的计数,从而获得频繁1-项集。如表10-2所示。 (3) L2进行自连接得到C3={{I1, I4, I5},{ I1, I2, I4},{ I1, I3, I4},{ I1, I3, I5},{ I2, I3, I4}, { I3, I4, I5}} 因为{ I1, I2, I4}的子集{ I1, I2,}和 { I1, I3, I4}、{ I1, I3, I5}的子集{ I1, I3,}及 { I2, I3, I4}的子集{ I2, I3}不在L2中 因此,从C3中删除{ I1, I2, I4}、{ I1, I3, I4}、{ I1, I3, I5}、 { I2, I3, I4}得: C3={{ I1, I4, I5},{ I3, I4, I5}}。然后再扫描数据库D,计算各项集的支持度计数,如表10.5所示,从而得到频繁3-项集L3,如表10.6所示。 关联规则挖掘算法 FP-growth FP-tree构造算法 扫

文档评论(0)

1亿VIP精品文档

相关文档