聚类分析-基因芯片幻灯片.pptVIP

  • 7
  • 0
  • 约3.5千字
  • 约 47页
  • 2016-08-12 发布于河南
  • 举报
第六章 聚类分析 §6.1 引言 §6.2 距离和相似系数 §6.3 系统聚类法 §6.4 动态聚类法 §6.1 引言 判别分析和聚类分析是两种不同目的的分类方法,它们所起的作用是不同的。判别分析方法假定组(或类)已事先分好,判别新样品应归属哪一组,对组的事先划分有时也可以通过聚类分析得到。聚类分析方法是按样品(或变量)的数据特征,把相似的样品(或变量)倾向于分在同一类中,把不相似的样品(或变量)倾向于分在不同类中。 聚类分析根据分类对象不同分为Q型和R型聚类分析。 §6.2 距离和相似系数 相似性度量:距离和相似系数。 距离常用来度量样品之间的相似性,相似系数常用来度量变量之间的相似性。 样品之间的距离和相似系数有着各种不同的定义,而这些定义与变量的类型有着非常密切的关系。 变量的测量尺度 通常变量按测量尺度的不同可以分为间隔、有序和名义尺度变量三类。 间隔尺度变量:变量用连续的量来表示,如长度、重量、速度、温度等。 有序尺度变量:变量度量时不用明确的数量表示,而是用等级来表示,如某产品分为一等品、二等品、三等品等有次序关系。 名义尺度变量:变量用一些类表示,这些类之间既无等级关系也无数量关系,如性别、职业、产品的型号等。 本章主要讨论具有间隔尺度变量的样品聚类分析方法。 距离有多种定义方法,在聚类分析中最常用的是欧氏距离,即有 当各变量的单位不同或测量值范

文档评论(0)

1亿VIP精品文档

相关文档