关于数据流top-K频繁模式挖掘算法的研究.pdf

优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考!!

中文摘要 数据流是近年来产生的一种新型数据模型,广泛出现在多种应用领域,如Web 点击流分析、交通流量监控与管理、电力供应管理与预测、传感器网络数据分析、 电信数据管理、金融服务、商业交易管理和分析等。数据流模型不同于传统的数 据库模型,具有快速、实时、连续、无界等特点,由此决定了数据流的查询或挖 掘算法与基于传统的数据库的挖掘技术有显著的区别,其算法应是单遍扫描 (one.pass)的。由于存贮容量的有限性,不可能完整地保存全部数据流元素。一 种有效的方法是设计一个远小于原数据流规模的结构,保存已流过数据的概要特 征,用于数据流的查询处理及分析,因而挖掘结果通常是近似的。鉴于数据流的 高速性和连续性,数据流算法应是动态增量的,亦必须是高时空效率的。现有的 数据库挖掘技术已不再适合数据流环境。因此,流数据环境下的数据挖掘研究具 有更大的机遇和挑战性。 论文针对数据流挖掘分析处理中的几个基本问题进行了探讨和研究,主要内 容如下: 1.动态增量地挖掘数据流界标窗口的top-K频繁模式。挖掘top-K频繁模式 在现实生活中有重要应用,为此我们研究有效算法TOPSIL.Miner动态增量地挖掘 数据流界标窗口的top-K频繁模式。设计了存储流数据摘要信息的概要结构 数据结

文档评论(0)

1亿VIP精品文档

相关文档