[17聚类分析.pptVIP

  • 1
  • 0
  • 约1.47万字
  • 约 46页
  • 2017-01-07 发布于北京
  • 举报
[17聚类分析

聚类分析 (cluster analysis) 广东药学院卫生统计学教研室 主要内容 聚类分析的基本思想 聚类分析的统计量 聚类分析的方法 系统聚类法 动态聚类法 聚类分析的正确应用 聚类分析的基本思想 聚类分析的基本思想 物以类聚:相似或相近的样本或指标归类 10名学生的某门功课成绩 聚类分析的基本思想 聚类分析的统计量 距离:用于样品聚类 欧氏距离 马氏距离 相似系数:用于变量聚类 相关系数 列联系数 聚类分析的统计量 欧氏距离(Euclidean distance) 缺陷: 受量纲影响; 没有考虑变量间的变异; 没有考虑变量间的相关。 聚类分析的统计量 马氏距离(Mahalanobis distance) Hotteling T2统计量 聚类分析的统计量 相关系数:用于定量变量 聚类分析的统计量 列联系数:用于定性变量 聚类分析的方法 系统聚类法(systematic cluster method) : 用于样品聚类(小样本) 、变量聚类 动态聚类法 用于样品聚类(大样本) 条件系统聚类法 用于有序样品聚类 系统聚类法基本步骤 构造n个类,每个类包含且只包含一个样品。 计算n个样品两两间的距离,构成距离矩阵,记作D0。 合并距离最近的两类为一新类。 计算新类与当前各类的距离。若类的个数等于1,转到

文档评论(0)

1亿VIP精品文档

相关文档