统计19章聚类分析2012–12–20.pptVIP

  • 14
  • 0
  • 约8.85千字
  • 约 39页
  • 2017-05-20 发布于北京
  • 举报
本例选用欧氏距离,类间距离选用最小相似系数法。为了克服变量量纲的影响,分析前先将变量标准化, 分别是Xi 的样本均数与标准差。变换后的数据列在表19-1的 , 列。 聚类过程如下: (1)计算4个样品间的相似系数矩阵,样品聚类中又称为距离矩阵。负重下蹲与引体向上之间的距离按公式(19-3)计算得 同样负重下蹲与俯卧撑之间的距离 同理,计算出距离矩阵 (2)G2,G4间距离最小,将G2,G4并成一新类G5={ G2,G4}。应用最小相似系数法,按公式(19-8)计算G5与其他各类之间的距离 G1,G3,G5的距离矩阵 (3)G1,G5间距离最小,将G1,G5并成一新类G6={ G1,G5}。计算G6 与G3之间的距离 (4)最终将G1 ,G6合并成G7={G1 , G6},所有指标形成一大类。 d15=Max(d12,d14)=Max(1.289,1.803)=1.803 d35=Max(d23,d34)=Max(1.928,2.168)=2.168 根据聚类过程,绘制出系统聚类图(见图19-2)。结合系统聚类图和专业知识认为分成两类较好:{ G1,G2,G4},{ G3}。负重下蹲、引体向上、仰卧起坐三个运动项目体能消耗较大,训练时应提高膳食标准。 图19-

文档评论(0)

1亿VIP精品文档

相关文档