数据挖掘导论第6章_关联分析.pptVIP

下载本文档

51
0
约1.2万字
约 95页
2016-11-28 发布于重庆
举报

数据挖掘导论第6章_关联分析.ppt

数据挖掘导论第6章_关联分析

(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 关联分析: 基本概念和算法定义:关联分析（association analysis）关联分析用于发现隐藏在大型数据集中的令人感兴趣的联系，所发现的模式通常用关联规则或频繁项集的形式表示。关联分析可以应用于生物信息学、医疗诊断、网页挖掘、科学数据分析等定义: 频繁项集（Frequent Itemset）项集（Itemset）包含0个或多个项的集合例子: {Milk, Bread, Diaper} k-项集如果一个项集包含k个项支持度计数（Support count ）(?) 包含特定项集的事务个数例如： ?({Milk, Bread,Diaper}) = 2 支持度（Support）包含项集的事务数与总事务数的比值例如： s({Milk, Bread, Diaper}) = 2/5 频繁项集（Frequent Itemset）满足最小支持度阈值（ minsup ）的所有项集定义: 关联规则（Association Rule）关联规则挖掘问题关联规则挖掘问题：给定事务的集合 T, 关联规则发现是指找出支

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

数据挖掘导论第6章_关联分析.pptVIP