数据挖掘导论第6章_关联分析.pptVIP

  • 51
  • 0
  • 约1.2万字
  • 约 95页
  • 2016-11-28 发布于重庆
  • 举报
数据挖掘导论第6章_关联分析

(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 关联分析: 基本概念和算法 定义:关联分析(association analysis) 关联分析用于发现隐藏在大型数据集中的令人感兴趣的联系,所发现的模式通常用关联规则或频繁项集的形式表示。 关联分析可以应用于生物信息学、医疗诊断、网页挖掘、科学数据分析等 定义: 频繁项集(Frequent Itemset) 项集(Itemset) 包含0个或多个项的集合 例子: {Milk, Bread, Diaper} k-项集 如果一个项集包含k个项 支持度计数(Support count )(?) 包含特定项集的事务个数 例如: ?({Milk, Bread,Diaper}) = 2 支持度(Support) 包含项集的事务数与总事务数的比值 例如: s({Milk, Bread, Diaper}) = 2/5 频繁项集(Frequent Itemset) 满足最小支持度阈值( minsup )的所有项集 定义: 关联规则(Association Rule) 关联规则挖掘问题 关联规则挖掘问题:给定事务的集合 T, 关联规则发现是指找出支

文档评论(0)

1亿VIP精品文档

相关文档