- 22
- 0
- 约4.74千字
- 约 28页
- 2019-05-06 发布于广东
- 举报
zf zf 第三章 聚类分析 第三节 3.5 非系统聚类法 也叫做逐步聚类法、动态聚类法、k-均值聚类法、或快速聚类法。——事先要确定分多少类 假定你说分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(SPSS软件自动为你选种子);也就是说,把这3个点作为三类中每一类的基石。 然后,根据和这三个点的距离远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来的“种子”就没用了),重新按照距离分类。 如此叠代下去,直到达到停止叠代的要求(比如,各类最后变化不大了,或者叠代次数太多了)。显然,前面的聚类种子的选择并不必太认真,它们很可能最后还会分到同一类中呢。下面用饮料例的数据来做k-均值聚类。 例:假定要把例1中16种饮料分成3类。 根据需要,可以输出哪些点分在一起。结果是: 第一类为饮料1、10; 第二类为饮料2、4、8、11、12、13、14; 第三类为剩下的饮料3、5、6、7、9、15、16。 K-均值聚类SPSS处理: 1、Analyze-Classify-K-Menas Cluster 2、Variables:calorie(热量)、caffeine(咖啡因)、sodium(钠)、price(价格) 3、Number of Clusters处选择3(想要分的类数) 4、如果想要知道哪种
原创力文档

文档评论(0)