系统聚类的方法.pptVIP

  • 7
  • 0
  • 约3.2千字
  • 约 32页
  • 2024-03-17 发布于广东
  • 举报

7.可变法第22页,课件共32页,创作于2023年2月 该方法是Ward提出来的,所以又称为Ward法。该方法的基本思想来自于方差分析,如果分类正确,同类样品的离差平方和应当较小,类与类的离差平方和较大。具体做法是先将n个样品各自成一类,然后每次缩小一类,每缩小一类,离差平方和就要增大,选择使方差增加最小的两类合并,直到所有的样品归为一类为止。 设将n个样品分成k类G1,G2,…,Gk,用Xit表示Gt中的第I 个样品,nt表示Gt中样品的个数,是Gt的重心,则Gt的样品离差平方和为8.离差平方和法第23页,课件共32页,创作于2023年2月关于系统聚类的方法第1页,课件共32页,创作于2023年2月聚类分析一聚类分析的定义二系统聚类的基本思想三八种系统聚类方法四类间距离的统一性第2页,课件共32页,创作于2023年2月一、聚类分析的定义“物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。因此,分类学已成为人们认识世界的一门基础科学。聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理。第3页,课件共32页,创作于2023年2月二、系统聚类的基本思想系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。系统聚类法是诸聚类分析方法中使用最多的一种,按下列步骤进行:计算n个样品两两之间的距离,构成距离矩阵合并距离最近的两类为一新类计算新类与当前各类的距离。再合并、计算,直至只有一类为止画聚类图,解释将n个样品各作为一类第4页,课件共32页,创作于2023年2月三、八种系统聚类方法在进行系统聚类之前,我们首先要定义类与类之间的距离,由类间距离定义的不同产生了不同的系统聚类法。常用的类间距离定义有8种之多,与之相应的系统聚类法也有8种,分别为最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法。它们的归类步骤基本上是一致的,主要差异是类间距离的计算方法不同。以下用dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。第5页,课件共32页,创作于2023年2月1.最短距离法 定义类与之间的距离为两类最近样品的距离,即为 (1) 设类与合并成一个新类记为,则任一类与的距离为 (2)第6页,课件共32页,创作于2023年2月最短距离法进行聚类分析的步骤如下: (1)定义样品之间距离,计算样品的两两距离,得一距离阵记为D(0),开始每个样品自成一类,显然这时Dij=dij。 (2)找出距离最小元素,设为Dpq,则将Gp和Gq合并成一个 新类,记为Gr,即Gr={Gp,Gq}。 (3)按(5.12)计算新类与其它类的距离。(4)重复(2)、(3)两步,直到所有元素。并成一类为止。如果某一步距离最小的元素不止一个,则对应这些最小元素的类可以同时合并。1.最短距离法第7页,课件共32页,创作于2023年2月【例1】设有六个样品,每个只测量一个指标,分别是1,2,5,7,9,10,试用最短距离法将它们分类。 (1)样品采用绝对值距离,计算样品间的距离阵D(0),见表1表11.最短距离法第8页,课件共32页,创作于2023年2月 (2)D(0)中最小的元素是D12=D56=1,于是将G1和G2合 并成G7,G5和G6合并成G8,并利用(5.12)式计算新类与其 它类的距离D(1),见表2表21.最短距离法第9页,课件共32页,创作于2023年2月 (3)在D(1)中最小值是D34=D48=2,由于G4与G3合并, 又与G8合并,因此G3、G4、G8合并成一个新类G9,其与其 它类的距离D(2),见表3表31

文档评论(0)

1亿VIP精品文档

相关文档