数据挖掘の基本关联分析.pptVIP

  • 5
  • 0
  • 约8.95千字
  • 约 72页
  • 2017-11-25 发布于湖北
  • 举报
数据挖掘の基本关联分析

(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 第6章:关联分析 — 基本概念和算法 关联分析的预备知识 频繁项集产生 规则产生 关联模式的评估 目的:介绍关联分析的基本概念、关联规则挖掘的基本方法,以及关联模式评估的度量 要求:掌握关联规则挖掘的Apriori算法,了解关联规则挖掘的其他方法,熟悉关联模式评估的典型度量 重点:用于频繁项集产生和规则产生的Apriori算法 难点:使用散列树(Hash Tree)的支持度计算方法 第6章:关联分析 — 基本概念和算法 关联分析的预备知识 频繁项集的产生 频繁项集产生的优化策略 计算复杂度的影响因素 频繁项集的紧凑表示 产生频繁项集的其他方法 规则产生 关联模式的评估 关联分析 给定一组事务,寻找预测 “某些项将会随其他项的出现而出现” 的规则 挖掘关联规则 定义: 频繁项集 项集 一个或多个项的集合 例子: {Milk, Bread, Diaper} k-项集 包含k个项的项集 支持度计数 (support count) 给定项集的出现次数 比如 ?({Milk, Bread,Diaper}) = 2 支持度 (support) 覆盖

文档评论(0)

1亿VIP精品文档

相关文档