- 28
- 0
- 约3.65万字
- 约 14页
- 2017-02-08 发布于河南
- 举报
数据流聚类算法D-Stream
Density-ased Clustering for Real-Time Stream Data
基于密度的实时数据流聚类(D-Stream)
翻译 y muyefei
E-mail: HYPERLINK mailto:muyefei@ muyefei@
注释:版权归作者所有,文档仅用于交流学习,可以用大纲视图查看文档结构
摘要:现有的聚类算法比如CluStream是基于k-means算法的。这些算法不能够发现任意形状的簇以及不能处理离群点。而且,它需要预先知道k值和用户指定的时间窗口。为了解决上述问题,本文提出了D-Stream算法,它是基于密度的算法。这个算法用一个在线部分将数据映射到一个网格,在离线部分计算网格的密度然后基于密度形成簇。算法采用了密度衰减技术来捕获数据流的动态变化。为了探索衰减因子、数据密度以及簇结构之间的关系,我们的算法能够有效的并且有效率地实时调整簇。而且,我们用理论证明了移除那些属于离群点的稀疏网格是合理的,从而提高了系统的时间和空间效率。该技术能聚类高速的数据流而不损失聚类质量。实验结果表明我们的算法在聚类质量和效率是有独特的优势,并且能够发现任意形状的簇,以及能准确地识别实时数据流的演化行为。
关键词
流数据挖掘 基于密度的聚类 D-Stream 分散的网格
1 介绍
实时聚类高维数据流是困难的但很重要。因为它在各个领域应用到。比如...
聚类
您可能关注的文档
最近下载
- 《鲁滨逊漂流记》名著导读好书推荐(共27张PPT).pptx VIP
- 建筑工地实习日记40篇.doc VIP
- 男患者导尿术操作评分标准.docx VIP
- 港口道路与堆场施工规范(JTS_T 216-2021).docx VIP
- 高职数学定积分及其应用教学能力比赛教案.pdf
- 高中数学计数原理.pdf VIP
- DB45_T 2562-2022 公路预应力混凝土梁预制技术规范.docx VIP
- 扶梯拆除施工方案.docx VIP
- GB 50058-2014 爆炸危险环境电力装置设计规范.docx VIP
- DB45_T2562-2022_公路预应力混凝土梁预制技术规范_广西壮族自治区 conv.docx VIP
原创力文档

文档评论(0)