大数据经典算法priori讲解.pptVIP

  • 6
  • 0
  • 约2.88千字
  • 约 32页
  • 2016-12-21 发布于贵州
  • 举报
小组成员 吴国泉、唐思远、赵清伟、张波 Questions 关联 分析 Solutions 关联规则是形如 的蕴含式, (支持度)规则 在事务集D中成立,支持度S是事务包含 的百分比。 Support( )= P( ) (置信度)置信度C是D中同时包含A的事务同时也包含B的百分比。 Confidence( )= P( )/P(A) (k项集)包含k个项的项集称为k项集,频繁k项集的集合记作 ,候选k项集的集合记作 。 (1)K维数据项集LK是频繁项集的必要条件是它所有K-1维子项集也为频繁项集,记为LK-1  (2)如果K维数据项集LK的任意一个K-1维子集LK-1,不是频繁项集,则K维数据项集LK本身也不是最大数据项集。 (3)LK是K维频繁项集,如果所有K-1维频繁项集集合LK-1中包含LK的K-1维子项集的个数小于K,则LK不可能是K维最大频繁数据项集。 (4)同时满足最小支持度阀值和最小置信度阀值的规则称为强规则。

文档评论(0)

1亿VIP精品文档

相关文档