数学地质系列______4聚类精读.ppt

类与类之间的距离:定义为它们的重心(均值)之间的(平方)欧氏距离。 设GK和GL的重心分别为xk和xL, 则GK与GL之间的平方距离为: (centroid method) 4. 重心法 设某一步将GK和GL合并的新类为GM, 它们的重心分别是Xk、XL、Xm, 它们各有nk、nL、nm(nm=nk+nL)个样品, 显然,新类GM与任一类GJ(重心为xJ)的平方距离是 这就是重心法的距离递推公式。 4. 重心法 重心法的归类步骤与以上三种方法基本上一样,所不同的是 每合并一次类,就要重新计算新类的重心及各类与新类的距离。 重心法在处理异常值方面比其它系统聚类法更稳健,有很好的代表性。 4. 重心法 常用系统聚类方法 (centroid method) 5. Ward最小方差法 常用系统聚类方法 (Ward’ minimum variance method ) 样品间:欧氏距离 类类间:离差平方和增量法 Ward最小方差法 由沃德提出,其思想来源于方差分析。 如果分类正确, Cluster K Cluster L Cluster M 同类样品的离差平方和 应当较小, 类与类之间的离差平方和应当较大。 设将n个样品分成k类:G1, G2, …, Gk, 用 表示

文档评论(0)

1亿VIP精品文档

相关文档