- 15
- 0
- 约4.61千字
- 约 55页
- 2018-03-25 发布于湖北
- 举报
张素文第2章聚类分析研讨
此例中 X1,X3,X4 ∈ Z1 X1 X2,X6 ∈ Z2 X6 X5,X7,X8,X9,X10 ∈ Z3 X7 §2.4 分级聚类法 (Hierarchical Clustering Method) (系统聚类法、层次聚类法) 思路:每个样本先自成一类, 然后按距离准则逐步合并,减少类数。 一、算法: 1、N个初始模式本自成一类,即建立N 类: 计算各类之间(即各样本间)的距离,得一N×N维距离矩阵D 0 。标号 0 表示初始状态。 G_Group 2、如在前一步聚类运算中,已求得距离矩阵D n (n为逐次聚类合并的次数),则找出D n 中的最小元素,将其对应的两类合并为一类。由此建立新的分类: 。 3、计算合并后新类别之间的距离,得D n+1 。 4、跳至第2步,重复计算及合并。 结束条件: 取距离阀值T,当D n 的最小分量超过给定值 T 时, 算法停止。所得即为聚类结果。 2 或不设阀值T,一直将全部样本聚成一类为止,输 出聚类的分级树。 类间距离计算准则: H K 最短距离法:如H、K是两个聚类,则两类间的最短距离定义为: :H类中的某个样本 和K类中的 某个样本 之间的欧氏距离。 :H类中所有样本与K类中所有 样本之间的最小距离。 其中, 如果K类由I和J两类合并而成,则 得到递推公式: √ H K I J ②最长距离法: 若K类由I
原创力文档

文档评论(0)