面向数据规模可扩展的并行优化K—means算法.pdfVIP

下载本文档

6
0
约2.22千字
约 3页
2017-08-11 发布于湖北
举报

面向数据规模可扩展的并行优化K—means算法.pdf

文章编号：1007—1423(2015)02—0003—03 DOI：10．3969／j．issn．1007-1423．2015．02．001 面向数据规模可扩展的并行优化 K—means算法李尧坤 f四川大学计算机学院，成都 610065) 摘要：传统的K—means算法迭代过程中需要加载全部的聚类样本数据，并且更新类中心过程是非并行的。针对传统 K— means算法处理数据规模小和类中心更新慢的问题，提出一种改进的K—means算法，面向解决 K—means单台机器处理数据规模扩展问题，和处理器利用率低效问题。实验验证，该方法能够高效地处理大规模数据聚类。关键词： K—means；大规模；更新类中心；并行 0 引言硬件资源配置，否则因为Had0op分布式框架本身的通信。调度开销。甚至会低于单台机器聚类效率。本文提聚类是用于划分空间中的数据方法．将相似的数

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

面向数据规模可扩展的并行优化K—means算法.pdfVIP

面向数据规模可扩展的并行优化K—means算法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档