关于K均值聚类算法的综述及改进分析.docVIP

  • 11
  • 0
  • 约5.35千字
  • 约 6页
  • 2018-03-29 发布于河南
  • 举报

关于K均值聚类算法的综述及改进分析.doc

关于K均值聚类算法的综述及改进分析

关于K均值聚类算法的综述及改进分析 摘要:K-means聚类算法是空间聚类领域的重要算法。本文在介绍了空间聚类规则的基础之上,同时叙述了经典的K-means算法,并总结了一些针对K-means算法的相关改进。 引言: 聚类算法是我们在模式识别中学到的知识,而空间聚类分析方法是空间数据挖掘理论中一个重要的领域,是从海量数据中发现知识的一个重要手段。K-means算法是空间聚类算法中应用非常广泛的算法,同时它也在聚类分析中起着重要作用。日益丰富的空间和非空间数据收集存储于空间数据库中,随着空间数据的不断膨胀,海量的空间数据的大小、复杂性都在快速增长,远远超出了人们的解译能力,从这些空间数据中发现邻域知识迫切需求产生一个多学科、多邻域综合交叉的新兴研究邻域,空间数据挖掘技术应运而生。 空间聚类: 空间聚类是空间数据挖掘的一个重要组成部分。作为数据挖掘的一个功能,空间聚类可以作为一个单独的工具用于获取数据的分布情况,观察每个聚类的特征,关注一个特定的聚类集合以深入分析。空间聚类也可以作为其它算法的预处理步骤,比如分类和特征描述,这些算法将在已发现的聚类上运行。 空间聚类规则是把特征相近的空间实体数据划分到不同的组中,组间的差别尽可能大,组内的差别尽可能小。空间聚类规则与分类规则不同,它不顾及已知的类标记,在聚类前并不知道将要划分成几类和什么样的类别,也不知道根据哪些空间区分规则来定义类。

文档评论(0)

1亿VIP精品文档

相关文档