ch聚类分析重点.ppt

ch聚类分析重点

层次聚类:先把每个样本作为一类,然后根据它们间的相似性和相邻性聚合。 相似性、相邻性一般用距离表示 1. 最短距离: 两类中相距最近的两样品间的距离 2、最长距离:两类中相距最远的两样本间的距离 10.3.2 层次聚类方法 最短距离举例: 最长距离举例: 3、中间距离:最短距离和最长距离都有片面性,因此有时用中间距离。设ω1类和ω23 类间的最短距离为d12,最长距离为d13,ω23 类的长度为d23,则中间距离为: 4、均值距离: 10.3.2 层次聚类方法 划分序列:N个样本自底向上逐步合并一类: 每个样本自成一类(划分水平1) K水平划分的进行:计算已有的c=N-K+2个类的类间距离矩阵D(K-1)=[dij](K-1),其最小元素记作d(K-1),相应的两个类合并成一类; 重复第2步,直至形成包含所有样本的类(划分水平N) 划分处于K水平时,类数c = N-K+1,类间距离矩阵D(K)=[dij](K),其最小元素记作d(K) 如果D(K) 阈值dT,则说明此水平上的聚类是适宜的 10.3.2 层次聚类方法 层次聚类树表示方法 y1 y2 y3 y4 y5 y6 1-水平 -- 2-水平 -- 3-水平 -- 4-水平 -- 5-水平 -- 6-水平 -- 分级 聚类 例:如下图所示 1、设全部样本分为6类 2、作距离矩阵D(0) G1 G2 G3 G4 G5

文档评论(0)

1亿VIP精品文档

相关文档