- 7
- 0
- 约7.58千字
- 约 13页
- 2016-12-06 发布于贵州
- 举报
数据流聚类法D-Stream
Density-Based Clustering for Real-Time Stream Data
基于密度的实时数据流聚类(D-Stream)
翻译 by muyefei
E-mail: muyefei@
注释:版权归作者所有,文档仅用于交流学习,可以用大纲视图查看文档结构
摘要:现有的聚类算法比如CluStream是基于k-means算法的。这些算法不能够发现任意形状的簇以及不能处理离群点。而且,它需要预先知道k值和用户指定的时间窗口。为了解决上述问题,本文提出了D-Stream算法,它是基于密度的算法。这个算法用一个在线部分将数据映射到一个网格,在离线部分计算网格的密度然后基于密度形成簇。算法采用了密度衰减技术来捕获数据流的动态变化。为了探索衰减因子、数据密度以及簇结构之间的关系,我们的算法能够有效的并且有效率地实时调整簇。而且,我们用理论证明了移除那些属于离群点的稀疏网格是合理的,从而提高了系统的时间和空间效率。该技术能聚类高速的数据流而不损失聚类质量。实验结果表明我们的算法在聚类质量和效率是有独特的优势,并且能够发现任意形状的簇,以及能准确地识别实时数据流的演化行为。
关键词
流数据挖掘 基于密度的聚类 D-Stream 分散的网格
1 介绍
实时聚类高维数据流是困难的但很重要。因为它在各个领域应用到。比如...
聚类是一项关键的数据挖掘任务。挖掘数据流
您可能关注的文档
最近下载
- 国际金融自考试题及详细答案.docx
- 2023年海南省初中学业水平考试英语卷试题真题(含答案).pdf VIP
- 2026陕西新高考政治全真高考冲刺模拟试卷(附答案解析).docx VIP
- 安徽电力工程线路设计方案(3篇).docx
- 量子算法与量子密码导论 课件 第1--3章 绪论、量子力学基础、量子线路模型.pptx VIP
- 脑电图基础知识及判读课件.pptx VIP
- SEMI F63-21 中文版 半导体加工用超纯水指南.docx VIP
- 高中数学抽象函数的解题思路与方法总结.docx VIP
- 2025年新青岛版六三制五下科学全册知识点.pdf
- 2026年北京事业单位公共基础知识.doc VIP
原创力文档

文档评论(0)