应用聚类(实验题).docVIP

  • 23
  • 0
  • 约2.95千字
  • 约 10页
  • 2016-12-25 发布于重庆
  • 举报
聚类方法---K均值算法(K-means)应用举例 一.算法 按照聚类的原理和方法,主要的聚类算法可以分为以下几类: (1) 基于划分的聚类:包括 1)k平均算法或称k均值算法(K-means);2)k中心点算法。 (2) 基于层次的聚类; (3) 基于密度的聚类; (4) 基于网格的聚类; (5) 基于模型的聚类. k均值(K-means)算法是一种简单使用的无监督学习算法,此种方法能够用于已知类数K的数据聚类和分析,基本步骤如下: 初始化:给定类的个数k,置j=0,从样本向量中任意选定k个向量作为聚类中心,,()。 其中,n为输入向量的维数,并记中心为的聚类块。 将每个样本向量,按下列欧几里得距离归入中心为的类中。 (1) 从新调整聚类中心,新的聚类中心由下式计算得出,即 , 式中: 是聚类块中的向量数。 如果(1)中的聚类中心()不再明显变换,就终止,否则 ,转(1)。 上述方法是一种迭代算法,可以采用下面的目标函数进行迭代,直到J不再明显改变为止。 二.算法应用 在本例中,利用k均值聚类方法,分析大中城市城镇居民家庭情况的相似性,表1为35个大中城市城镇居民家庭基本情况表。 把35个大中城市分为五类,每个城市用7个属性描述,即样本个数为35,样本向量维数7,采用K均值聚类算法进行分类,在算法公式(1)中,向量的维数n

文档评论(0)

1亿VIP精品文档

相关文档