聚类方法(第11章)00.pptVIP

  • 16
  • 0
  • 约4.61千字
  • 约 38页
  • 2017-05-19 发布于四川
  • 举报
聚类方法(第11章)00

第三步:根据新分成的两类建立新的聚类中心 第四步: ∵ 转第二步。 第二步:重新计算 到z1(2) , z2(2) 的距离,把它们归为最近聚类中心,重新分为两类, 第三步,更新聚类中心 第四步, 第二步, 第三步,更新聚类中心 说明: (1)K是指需要分成K类,均值是指每类的中心,就是该类所有样本的平均值,不一定就有某个样本在这个位置上。 (2)算法的收敛性判别:前后两次迭代的结果,也就是每迭代分类后,分类都是一样的,此时停止。 (3)K值和初始聚类中心对分类的结果影响很大。通常需要其它的算法来确定这两个的选取。 讨论 K-均值算法的结果受如下选择的影响: 所选聚类的数目 聚类中心的初始分布 模式样本的几何性质 读入次序 在实际应用中,需要试探不同的K值和选择不同的聚类中心的起始值。 如果模式样本可以形成若干个相距较远的孤立的区域分布,一般都能得到较好的收敛效果。 K-均值算法比较适合于分类数目已知的情况。 作业 1. 给定5个6维模式样本(如下),试按最小(欧氏)距离准则进行系统聚类分析。 2.已知十个样本,每个样本2个特征,数据如下: 用K-均值算法分成3类。 样本序号 1 2 3 4 5 6 7 8 9 10 x1 0 1 2 4 5

文档评论(0)

1亿VIP精品文档

相关文档