数据流挖掘算法研讨.pdfVIP

  • 14
  • 0
  • 约6.82万字
  • 约 54页
  • 2018-06-07 发布于贵州
  • 举报
数据流挖掘算法研讨

摘要 摘要 近年来,得益于数据采集技术的发展,许多应用中的数据是以流的形式产生 的。分析和挖掘这类数据日益成为热点问题。相对于传统的静态数据库,数据流 有以下特点:(1)数据量是潜在无界的;(2)数据有很快的到达率;(3)不允许 反复扫描历史数据。 数据流的特点决定了数据流挖掘必须满足如下基本要求:首先,算法需要及 时处理高速到达的数据,因此,算法的计算复杂度要低;再者,有限的内存不可 能存储无界的数据量,因此,算法需要保持较低的空间复杂度,维持一个基本的 近似空间并在此得到问题的近似解;此外,由于数据流的动态性,算法必须动态 调整自身参数以适应数据流的变化。 传统的数据挖掘算法很难同时满足以上三个条件,需要对以往数据挖掘算法 进行改进或者设计出适应数据流的挖掘算法。近年来,数据流挖掘的研究己取得 很大进展,然而,这些新方法仍具有很大的局限性,能够处理数据流的种类也很 有限。 本文主要工作有如下两个方面: 1.本文提出一种高维混合型数据流的可视化算法。在尽量保证数据之间区分 度的前提下,算法动态调整参数,把数值型数据和分类型数据分别按照不同方法 映射到颜色空间上,由此得到最近一段时

文档评论(0)

1亿VIP精品文档

相关文档