基于内存并行化聚类的用户用电行为分析.pdfVIP

  • 1
  • 0
  • 约1.46万字
  • 约 4页
  • 2026-05-20 发布于江西
  • 举报

基于内存并行化聚类的用户用电行为分析.pdf

计算机应用信息技术信息化

基于内存并行化聚类的用户用电行为分析

11

黄东升郭崇

摘要针对经典K-means选取初始值具有一定的盲目性和不确定性,提出了基于Canopy+算法的改进K-means

聚类算法。首先对实验数据进行预处理,并从每条日负荷数据提取六个特征值;然后搭建Spark大数据

集群,利用集群具有的内存并行化特点,提升改进聚类算法处理大规模数据的能力;最后将预处理后的

用户日负荷数据进行单机K-means以及改进后算法的集群聚类。实验结果表明,在降低迭代次数的基

础上,改进后集群聚类算法误差平方和降低3659.906、轮廓系数提高0.03、DB指数下降0.06。使用改

进后算法将电力用户划分为五个类别,其中具有调峰潜力、较优质的需求侧响应用户为第5类用户。

关键词

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档