聚类分析 -1幻灯片.pptVIP

  • 28
  • 0
  • 约8.8千字
  • 约 84页
  • 2017-05-22 发布于河南
  • 举报
第二章聚类分析 §1.2距离和相似系数 描述变量之间亲疏关系的统计量有很多,目前应用最多的是距离和相似系数,这两个统计量与变量类型密切相关,因此首先回顾一下变量类型 一、变量测量尺度的类型 (1)间隔尺度。指标度量时用数量来表示,其数值由测量或计数、统计得到,如长度、重量、收入、支出等。一般来说,计数得到的数量是离散数量,测量得到的数量是连续数量。在间隔尺度中如果存在绝对零点,又称比例尺度。 (2)顺序尺度 指标度量时没有明确的数量表示,只有次序关系,或虽用数量表示,但相邻两数值之间的差距并不相等,它只表示一个有序状态序列。如评价酒的味道,分成好、中、次三等,三等有次序关系,但没有数量表示。 (3)名义尺度 指标度量时既没有数量表示也没有次序关系,只有一些特性状态,如眼睛的颜色,化学中催化剂的种类等。在名义尺度中只取两种特性状态的变量是很重要的,如电路的开和关,天气的有雨和无雨,人口性别的男和女,医疗诊断中的“十”和“一”,市场交易中的买和卖等都是此类变量。 0 2 5.5 0 3.5 0 0 3.5 0 D(2) D(3) X1 X2 X3 X4 X5 1 2 3 4 1 G6 1.5 G7 2 G8 G9 谱系图 2.最长距离法 定义类和类之间

文档评论(0)

1亿VIP精品文档

相关文档