- 10
- 0
- 约1.95千字
- 约 79页
- 2019-12-28 发布于上海
- 举报
K-均值聚类分析
K-means Cluster;基本原理
具体做法
1、按照指定的分类数目n,按某种方法选择某些观测量,设为{Z1,Z2,…Zn},作为初始聚心。
2、计算每个观测量到各个聚心的欧氏距离。即
按就近原则将每个观测量选入一个类中,然后计算各个类的中心位置,即均值,作为新的聚心。
3、使用计算出来的新聚心重新进行分类,分类完毕后继续计算各类的中心位置,作为新的聚心,如此反复操作,直到两次迭代计算的聚心之间距离的最大改变量小于初始聚类心间最小距离的倍??时,或者到达迭代次数的上限时,停止迭代。;数据标准化处理:;存储中间过程数据;数据标准化处理,并存储。;指定5类;收敛标准值;存储最终结果输出情况,在数据文件中(QCL-1、QCL-2);初始聚心选项,输出方差分析表;初始聚类中心表;具体城市看后表;聚类结果:QCL-1说明聚类结果,QCL-2说明聚类的长度情况;系统聚类法
Hierarchical Cluster;应用实例;按公式计算两两样品间的相似系数,得相似矩阵;作聚类分析图;一、问题提出
聚类分析——对一批样品或指标进行分类的一种统
计方法。;2)形成一个由小到大的分析系统。
3)把整个分类系统画成一张分类图;二、聚类统计量;对于任意两个样品Xi和Xj的相似程度可用这两个向量
原创力文档

文档评论(0)