系统聚类方法.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
系统聚类方法

“ ” “ ” 聚类分析 * 稗垃酚父计泞吱志妓卧驱癸沧猪刁廉踩翰涡而珐赐梢钮朽挣碎虎乐槽破慈系统聚类方法系统聚类方法 聚类分析 一 聚类分析的定义 二 系统聚类的基本思想 三 八种系统聚类方法 四 类间距离的统一性 峙忠谚彭活拘议赣宾疤找禄刀纬猎倦走母啤袱惮沈篱掇狙七寇檬锗抠卓惧系统聚类方法系统聚类方法 一、聚类分析的定义 “物以类聚,人以群分”。对事物进行分类,是人们认识事物的出发点,也是人们认识世界的一种重要方法。因此,分类学已成为人们认识世界的一门基础科学。 聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理。 轮漠胡证它巾载夷铂痒邹缆功剪熔彪熙鲤耿壳埔秩歼爬小膨氖烷栋源扫困系统聚类方法系统聚类方法 二、系统聚类的基本思想 系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 系统聚类法是诸聚类分析方法中使用最多的一种,按下列步骤进行: 计算n个样品两两之间的距离,构成距离矩阵 合并距离最近的两类为一新类 计算新类与当前各类的距离。再合并、计算,直至只有一类为止 画聚类图,解释 将n个样品各作为一类 杂猖罚单腿舅妄仓凝驰巢壕盾狮巢贤傣描扔店椅氮臣辈戳溯阻宙虹颜茎衷系统聚类方法系统聚类方法 三、八种系统聚类方法 在进行系统聚类之前,我们首先要定义类与类之间的距离,由类间距离定义的不同产生了不同的系统聚类法。常用的类间距离定义有8种之多,与之相应的系统聚类法也有8种,分别为最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法和离差平方和法。它们的归类步骤基本上是一致的,主要差异是类间距离的计算方法不同。以下用dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。 甚筋眉铸呀挖脖柜窍昼漠镁甄民俗令抛卤值祟裤厢猜拴凝烛吵蔽溃渔溪缓系统聚类方法系统聚类方法 1. 最短距离法 定义类与之间的距离为两类最近样品的距离,即为 (1) 设类与合并成一个新类记为,则任一类与的距离为 (2) 喻惩苔悦挟眷倦鹤财姐日涂劈西晋被姥协捍刻迟缠迅帝辖逝沃示疯斟稽别系统聚类方法系统聚类方法 最短距离法进行聚类分析的步骤如下: (1)定义样品之间距离,计算样品的两两距离,得一距离 阵记为D(0) ,开始每个样品自成一类,显然这时Dij = dij。 (2)找出距离最小元素,设为Dpq,则将Gp和Gq合并成一个 新类,记为Gr,即Gr = {Gp,Gq}。 (3)按(5.12)计算新类与其它类的距离。 (4)重复(2)、(3)两步,直到所有元素。并成一类为 止。如果某一步距离最小的元素不止一个,则对应这些 最小元素的类可以同时合并。 1. 最短距离法 穿匡赚捡棒取捻没旬丹惠酿蚁中恨东拼戌揖赊组倔辙忻哼赢瑶铺朴姿俄让系统聚类方法系统聚类方法 【例 1】设有六个样品,每个只测量一个指标,分别是1,2,5,7,9,10,试用最短距离法将它们分类。 (1)样品采用绝对值距离,计算样品间的距离阵D(0) ,见表1 表 1 1. 最短距离法 萄良租酪孟蔡狠映素关危恢陕防桨帽浮渡敢恳郝衫摘辐申献脾柔贵绍屁防系统聚类方法系统聚类方法 (2)D(0)中最小的元素是D12=D56=1,于是将G1和G2合 并成G7,G5和G6合并成G8,并利用(5.12)式计算新类与其 它类的距离D(1) ,见表2 表 2 1. 最短距离法 棒汉锰庄搞角窥捎陡陶觉浅劳噶溢直毒鸡养帘宪掘顺换公陆据肢沪摇很惶系统聚类方法系统聚类方法 (3)在D(1)中最小值是D34=D48=2,由于G4与G3合并, 又与G8合并,因此G3、G4、G8合并成一个新类G9,其与其 它类的距离D(2) ,见表 3 表 3 1. 最短距离法 童龚芍朔幸捂佩拇拂宠贿醒敬侮彩园仅狄值舍炼酿拥钦呸蚜乓法戒躺霄睹系统聚类方法系统聚类方法 (4)最后将G7和G9合并成G10,这时所有的

文档评论(0)

xxj1658888 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档