应用聚类(实验题).docVIP

下载本文档

23
0
约2.95千字
约 10页
2016-12-25 发布于重庆
举报

应用聚类(实验题).doc

聚类方法---K均值算法（K-means）应用举例一．算法按照聚类的原理和方法，主要的聚类算法可以分为以下几类： (1) 基于划分的聚类：包括 1）k平均算法或称k均值算法（K-means）；2）k中心点算法。 (2) 基于层次的聚类; (3) 基于密度的聚类; (4) 基于网格的聚类; (5) 基于模型的聚类. k均值（K-means）算法是一种简单使用的无监督学习算法，此种方法能够用于已知类数K的数据聚类和分析，基本步骤如下：初始化：给定类的个数k,置j=0,从样本向量中任意选定k个向量作为聚类中心，，（）。其中，n为输入向量的维数，并记中心为的聚类块。将每个样本向量，按下列欧几里得距离归入中心为的类中。（1）从新调整聚类中心，新的聚类中心由下式计算得出，即，式中：是聚类块中的向量数。如果（1）中的聚类中心（）不再明显变换，就终止，否则，转（1）。上述方法是一种迭代算法，可以采用下面的目标函数进行迭代，直到J不再明显改变为止。二.算法应用在本例中，利用k均值聚类方法，分析大中城市城镇居民家庭情况的相似性，表1为35个大中城市城镇居民家庭基本情况表。把35个大中城市分为五类，每个城市用7个属性描述，即样本个数为35，样本向量维数7，采用K均值聚类算法进行分类，在算法公式（1）中，向量的维数n

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

应用聚类(实验题).docVIP