面向数据规模可扩展的并行优化K—means算法.pdfVIP

  • 6
  • 0
  • 约2.22千字
  • 约 3页
  • 2017-08-11 发布于湖北
  • 举报

面向数据规模可扩展的并行优化K—means算法.pdf

文章编号:1007—1423(2015)02—0003—03 DOI:10.3969/j.issn.1007-1423.2015.02.001 面向数据规模可扩展的并行优化 K—means算法 李尧坤 f四川大学计算机学院,成都 610065) 摘要 : 传统的K—means算法迭代过程中需要加载全部的聚类样本数据,并且更新类中心过程是非并行 的。针对传统 K— means算法处理数据规模小和类中心更新慢的问题 ,提出一种改进的K—means算法 ,面向解决 K—means单台机器处 理数据规模扩展问题,和处理器利用率低效问题。实验验证,该方法能够高效地处理大规模数据聚类。 关键词 : K—means;大规模;更新类中心 ;并行 0 引言 硬件资源配置 ,否则因为Had0op分布式框架本身的通 信。调度开销。甚至会低于单台机器聚类效率。本文提 聚类是用于划分空间中的数据方法 .将相似的数

文档评论(0)

1亿VIP精品文档

相关文档