数据挖掘2015最新精品课程完整课件(第5讲)---关联规则挖掘与其它问题.pptVIP

  • 0
  • 0
  • 约2.38千字
  • 约 27页
  • 2017-12-28 发布于江苏
  • 举报

数据挖掘2015最新精品课程完整课件(第5讲)---关联规则挖掘与其它问题.ppt

数据挖掘2015最新精品课程完整课件(第5讲)---关联规则挖掘与其它问题

关联规则挖掘的其它问题 主要内容 基于多最小支持度的关联规则 关联规则的评价 支持度的分布 大多数数据集中支持度的分布都不平衡 一个零售数据集中支持度的分布 支持度的分布 如何合理设置最小支持度阈值minsup? minsup过高, 可能会丢失稀有的、令人感兴趣的项目 (如,贵重商品或耐用品)。 minsup过低, 则计算开销过大,结果项集过多。 使用单一的最小支持度效果不佳。 多最小支持度模型 每个项目都有一个最小支持度(Minimum Item Supports, MIS) 。 通过为不同的项目提供不同的MIS值,用户可以表达对不同规则的不同支持度的需求。 多最小支持度举例 MIS(Milk)=5%, MIS(Coke) = 3%, MIS(Broccoli)=0.1%, MIS(Salmon)=0.5% MIS({Milk, Broccoli}) = min (MIS(Milk), MIS(Broccoli)) = 0.1% 支持度不再满足反单调性 假设: Support(Milk, Coke) = 1.5% 且 Support(Milk, Coke, Broccoli) = 0.5% {Milk,Coke} 不频繁,但 {Milk,Coke,Broccoli} 频繁 MSaprior

文档评论(0)

1亿VIP精品文档

相关文档