多元统计分析均值向量与 及协方差阵的检验.ppt

多元统计分析均值向量与 及协方差阵的检验.ppt

多元统计分析均值向量与 及协方差阵的检验.ppt

8、重心法 用重心法对5个样品进行分类。首先采用绝对距离计算距离平方矩阵: ? 0 ? ? ? ? 1 0 ? ? ? 6.25 2.25 0 ? ? 36 25 12.25 0 ? 64 49 30.25 4 0 分别为Gp和Gq的重心,类与类之间的距离定义为 两个类重心(类内样品平均值)间的平方距离。 重心法,也称为样品的均值法。设Gp和Gq 为两个类 设某一步Gp和Gq的重心分别为为和,类内的样品数分别为和,如果要把Gp和Gq合并为Gr类,则Gr类的样品数nr=np+nq,Gr类的重心为 和 的加权算术平均数: 重心法递推公式 假设第p类和第q类合并成第r类,第r类与其它各旧类 的距离按重心法为: G4和G6的距离为 6、可变方法 7、离差平方和法 离差平方和法 (三)确定类的个数 在聚类分析过程中类的个数如何来确定才合适呢?这是一个十分困难的问题,人们至今仍未找到令人满意的方法。但是这个问题又是不可回避的。下面我们介绍几种方法。 1、给定阈值——通过观测聚类图,给出一个合适的阈值T。要求类与类之间的距离不要超过T值。例如我们给定T=0.35,当聚类时,类间的距离已经超过了0.35,则聚类结束。 总离差平方和的分解(准备知识) 如果样品被分成两类 可以证明:

文档评论(0)

1亿VIP精品文档

相关文档