统计学聚类分析介绍教学.ppt

统计学;第十一章聚类分析 ;分类;聚类分析;饮料数据(drink.txt );11.1如何度量距离远近?;11.1如何度量距离远近?;两个距离概念;两个距离概念;两个距离概念;最长距离(Furthest Neighbor ) ;; 组内平均连接法(Within-group Linkage) ;重心法(Centroid clustering):均值点的距离 ;离差平方和法连接;红绿(2,4,6,5)8.75 离差平方和增加8.75-2.5=6.25 黄绿(6,5,1,5)14.75 离差平方和增加14.75-8.5=6.25 黄红(2,4,1,5)10-10=0 故按该方法的连接和黄红首先连接。;有了上面的点间距离和类间距离的概念,就可以介绍聚类的方法了。这里介绍两个简单的方法。 ;11.2 事先要确定分多少类:k-均值聚类 ;11.2 事先要确定分多少类:k-均值聚类 ;假定要把这16种饮料分成3类。利用SPSS,只叠代了三次就达到目标了(计算机选的种子还可以)。这样就可以得到最后的三类的中心以及每类有多少点 ;根据需要,可以输出哪些点分在一起。结果是:第一类为饮料1、10;第二类为饮料2、4、8、11、12、13、14;第三类为剩下的饮料3、5、6、7、9、15、16。;SPSS实现(聚类分析);11.2 事先不用确定分多少类:分层聚类 ;对于饮料聚类。 SPSS输出为

文档评论(0)

1亿VIP精品文档

相关文档