数据挖掘第二讲学材.ppt

数据挖掘第二讲学材

* * 关联规则挖掘 的主要挑战 主要挑战:会产生大量满足min_sup的项集,尤其当min_sup设置得低的时候 E.g. 一个长度为100的频繁项集{a1,a2,…,a100}包含的频繁项集的总个数为 关联规则挖掘分类 (1) 根据挖掘的模式的完全性分类:给定min_sup,可以挖掘频繁项集的完全集,闭频繁项集和极大频繁项集。也可以挖掘被约束的频繁项集(即满足用户指定的一组约束的频繁项集)、近似的频繁项集(只推导被挖掘的频繁项集的近似支持度计数)、接近匹配的频繁项集(即与接近或几乎匹配的项集的支持度计数符合的项集)、top-k频繁项集 关联规则挖掘分类 (2) 根据规则集所涉及的抽象层 单层关联规则 多层关联规则 (挖掘的规则集由多层关联规则组成) E.g. 下例购买的商品涉及不同的抽象级 根据规则中设计的数据维 单维关联规则 E.g.(仅涉及buys这个维) 多维关联规则 关联规则挖掘分类 (3) 根据规则中所处理的值类型 布尔关联规则(规则考虑的关联为项是否出现) 量化关联规则(规则描述量化的项或属性间的关联) 根据所挖掘的规则类型分类 关联规则 相关规则 强梯度联系 关联规则挖掘分类 (4) 根据所挖掘的模式类型分类 频繁项集挖掘 从事务或关系数据集中挖掘频繁项集 序列模式挖掘 从序列数据集中搜索频繁子序列 结构模式挖掘 在结构化数据集中搜索频繁子结构 由

文档评论(0)

1亿VIP精品文档

相关文档