频繁项集挖掘问题及研究.pdf

兰州大学博上论文 频繁项集挖掘问题的研究 摘要 频繁项集挖掘是一类基本的数据挖掘问题,可以广泛应用在关 联规则分析、相关性分析、孤立点分析、分类和聚类等多种数据挖 掘任务中。本文对频繁项集挖掘问题进行了深入的研究和探索,主 要研究工作内容和贡献如下: t、对频繁项集挖掘中搜索空间剪枝问题进行深入研究,在认 真分析现有的7种搜索空问剪枝策略的基础上,提出了两种新的搜 索空间剪枝策略:扩展支持度相等性剪枝策略l和扩展支持度相等 性剪枝策略2。它们都基于项集的扩展支持度相等性进行搜索空间 削减,可用于最大频繁项集挖掘任务和封闭频繁项集挖掘任务,对 其它剪枝策略无法处理的搜索空间有效地进行剪枝。同时证明了相 关的定理和推论,保证了这两种新的搜索空间剪枝策略的正确性和 有效性。 2、进行最大频繁项集挖掘算法的研究。在详细分析公认的高 效最大频繁项集挖掘算法一一MAFIA算法的基础上,应用新的搜索 空间剪枝策略对MAFIA算法进行优化改进,得到效率更高的最大频 繁项集挖掘算法一一MAFIA+算法。通过实验对改进后的算法进行 验证,实验结果表明,MAFIA+算

文档评论(0)

1亿VIP精品文档

相关文档