- 14
- 0
- 约6.82万字
- 约 54页
- 2018-06-07 发布于贵州
- 举报
数据流挖掘算法研讨
摘要
摘要
近年来,得益于数据采集技术的发展,许多应用中的数据是以流的形式产生
的。分析和挖掘这类数据日益成为热点问题。相对于传统的静态数据库,数据流
有以下特点:(1)数据量是潜在无界的;(2)数据有很快的到达率;(3)不允许
反复扫描历史数据。
数据流的特点决定了数据流挖掘必须满足如下基本要求:首先,算法需要及
时处理高速到达的数据,因此,算法的计算复杂度要低;再者,有限的内存不可
能存储无界的数据量,因此,算法需要保持较低的空间复杂度,维持一个基本的
近似空间并在此得到问题的近似解;此外,由于数据流的动态性,算法必须动态
调整自身参数以适应数据流的变化。
传统的数据挖掘算法很难同时满足以上三个条件,需要对以往数据挖掘算法
进行改进或者设计出适应数据流的挖掘算法。近年来,数据流挖掘的研究己取得
很大进展,然而,这些新方法仍具有很大的局限性,能够处理数据流的种类也很
有限。
本文主要工作有如下两个方面:
1.本文提出一种高维混合型数据流的可视化算法。在尽量保证数据之间区分
度的前提下,算法动态调整参数,把数值型数据和分类型数据分别按照不同方法
映射到颜色空间上,由此得到最近一段时
原创力文档

文档评论(0)