(6.4.1)--6.4压缩频繁项集.pdfVIP

  • 2
  • 0
  • 约5.51千字
  • 约 8页
  • 2022-11-12 发布于广东
  • 举报
Chapter 6.4 压缩频繁项集 6.4 压缩频繁项集 41 • 在实际应用中,当最小支持度阈值较低或者数据规模较大时,使用频繁模式挖 掘事务数据可能产生过多的频繁项集; • 而闭频繁模式、极大模式等模式可以显著减少频繁模式挖掘所产生的频繁项集 数量。 6.4 压缩频繁项集 42 1. 挖掘闭模式 如果 X Y,且Y中至少有一项不在X 中,那么Y是X 的真超项集。如果在 数据集中不存在频繁项集X 的真超项集Y,使得X 、Y的支持度相等,那么称项 集X是这个数据集的闭频繁项集。 6.4 压缩频繁项集 43 2. 剪枝的策略 – 项合并 • 如果包含频繁项集X的每个事务都包含项集Y ,但不包含Y的任何真超集,则X∪Y形成一个 闭频繁项集,并且不必搜索包含X但不包含Y的任何项集。 – 子项集剪枝 • 如果频繁项集

文档评论(0)

1亿VIP精品文档

相关文档