k-means算法资料.pptVIP

  • 2
  • 0
  • 约1.91千字
  • 约 15页
  • 2016-12-16 发布于湖北
  • 举报
数据挖掘流程 监督学习 算法概要 从上图中,我们可以看到,A,B,C,D,E是五个在图中点。而灰色的点是我们的种子点,也就是我们用来找点群的点。有两个种子点,所以K=2。 算法步骤 随机在图中取K(这里K=2)个种子点。 然后对图中的所有点求到这K个种子点的距离,假如点Pi离种子点Si最近,那么Pi属于Si点群。(上图中,我们可以看到A,B属于上面的种子点,C,D,E属于下面中部的种子点) 接下来,我们要移动种子点到属于他的“点群”的中心。(见图上的第三步) 然后重复第2)和第3)步,直到,种子点没有移动(我们可以看到图中的第四步上面的种子点聚合了A,B,C,下面的种子点聚合了D,E)。 K-means K-means面对的第一个问题是如何保证收敛 求点群中心的算法 求点群中心的算法 k-means演示 如果你以”K Means Demo“为关键字到Google里查你可以查到很多演示。这里推荐一个演示:http://home.dei.polimi.it/matteucc/Clustering/tutorial_html/AppletKM.html K-Means主要有两个最重大的缺陷——都和初始值有关: K是事先给定的,这个K值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适。(ISODATA算法通过类的自动合并

文档评论(0)

1亿VIP精品文档

相关文档