数据流频繁项挖掘算法.pdf

摘要 挖掘数据流的频繁项已受到广泛关注,研究者们提出了一些高效的数据流上 挖掘频繁项的算法,尽管这些算法能够比较好的找到频繁项,但对频繁项频数的 仅能够较准确地挖掘出频数较高的数据项,还能够尽可能准确地返回其频数。 相比当前两种最好的经典算法(Freq和SS算法),在同样空间代价情况下, 我们的三种算法无论在模拟数据集和真实数据集实验中,都表现出较高的个数准 确率、较低的频数偏差率,和较高的频数保有率。尤其是,当数据分布较为平缓 时(在模拟实验中体现为标准差增大),我们的三种算法表现出更好的性能。其 中,RFreq算法相比其他算法优势明显。 续对这三个算法的参数作进一步优化,以期达到更好的效果。 关键词:频繁项;Top—K;数据流;数据挖掘 中图法分类号TP391 Abstract datastreamhasdrawn some itemsOVer greatattention,and Miningfrequent efficient havebeen the

文档评论(0)

1亿VIP精品文档

相关文档