- 2
- 0
- 约2.65千字
- 约 5页
- 2019-07-03 发布于广东
- 举报
一种对滑动窗口数据流聚类算法的混合差分研究
摘要传统的滑动窗口数据流聚类算法在执行中存在聚类质量较
差、效率较低的缺点,而基于混合差分进化的算法,将滑动窗口数据流聚
类过程进行划分,一类是在线的时序窗门数据流特征向量生成,另一类是
离线的聚类优化。对于在线式滑动窗口,其数据表现为微簇聚合更新与维
护,可以通过粒子群算法,以离线微簇数据进行适应度计算,并将种群划
分为优势子种群和普通子种群,利用个体适应度值和平均适应度值来进行
最优选择,采用迭代法来对个体进行进化,输出最优适应度值的聚类集合。
关键词滑动窗口数据流混合差分进化聚类
数据聚类分析是数据挖掘中的重要课题,也是通过对数据进行层次化
模型分析,对指数级数据增长下的传统聚类算法的优化,以满足数据流处
理的实时要求。比较经典的算法冇CluStream,将数据流看作时序读取过
程,在数据处理周期内完成聚类。数据流聚类算法是基于聚类半径的增长,
数据聚类精度的提升对内存消耗过大而采用的优化算法,其优势在于构建
数据流聚类在线、离线框架,满足数据入点、流出点之间数据流处理需要,
但由于数据快照窗口的失效数据为实时更新,导致计算机负载过大。基于
滑动窗口的数据流聚类算法,能够在占用窗口大小的次线性内存空间中,
对数据记录分部展幵进行聚类分析.
一、数据流聚类算法基础概念明确
对于混合差分进化下的滑动窗口数据流聚类算法的研宂,主要通过在
原创力文档

文档评论(0)