DATAMINING(CH2)摘要.ppt

数据挖掘与知识发现(第2版) (42-*) 多级关联规则 由于多维数据空间上的数据稀少,在低层或原始抽象级别上很难发现数据项间的强关联(Strong Associations)。 Han等人指出强关联在高层概念上可以描述通常意义的知识。 多级关联规则可以在不同的抽象空间上描述多层抽象知识。 数据挖掘与知识发现(第2版) (42-*) 多级关联规则 多级关联规则的挖掘可以沿用“支持度和信任度”的框架。 挖掘多级关联规则时可采用自上而下,深度优先的方法,由较抽象的概念层开始向下,到较低的具体概念层(如原始概念层),对每个概念层的频繁项集累加计数,直到再也找不到频繁项集为止。 Apriori算法及其变种算法均可以应用到每一级频繁项集的发现上。 多级关联规则模型分类: 所有级别采用统一的最小支持度阈值; 低级别上采用较小的最小支持度阈值。 数据挖掘与知识发现(第2版) (42-*) 多级关联规则 可以用如下几种策略来设置不同的支持度阈值。 1. 各级间相互独立。在深度优先的检索中没有任何频繁项集的背景知识用于剪枝。对每个节点的处理与其父节点是否为频繁项集无关。 2. 各级之间单项过滤。算法考察第i级项目的充分必要条件为(i–1)级的相应父节点为频繁项集。也就是在一般关联关系的基础上研究更详尽的关联规则。 3. 各级之间项集过滤。如果考察第i级的k项集,当且仅当(i–1)级的相应

文档评论(0)

1亿VIP精品文档

相关文档