第七章聚類分析.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章聚類分析

第七章 聚类分析 §1 系统聚类法(I) 一、距离系数 聚类分析是研究“物以类聚”的一种统计方法,通常以“距离”和“相似系数”为依据来进行聚类。本节以“距离”为依据的有最短距离法、最长距离法及中间距离法等聚类方法。 设有n个样品,每个样品测定m个指标,其数据矩阵为: 计算点Xi与点Xj间的距离公式有: (1)绝对值距离 (2)欧氏距离 (3)明氏距离 ① 即绝对值距离 ② 即欧氏距离 二、聚类步骤 (1)将n个样品各自成一类; (2)计算样品间的距离,将距离最近的两个样品并成一类; (3)计算新类与其余各类的距离,再将距离最近的两类合并,重复上述步骤直到所有样品归成一类为止。 三、聚类方法(最短距离法、最长距离法、中间距离法) 类与类之间的距离有许多定义的方法,就产生不同的聚类方法,以下用dij表示样品Xi与Xj间的距离,用Dij表示类Gi与Gj间的距离。首先介绍最短距离法、最长距离法及中间距离法。 1.最短距离法 (1) (2)若,则新类Gr与其它各类Gk间距离: 2.最长距离法 (1) (2) 3.中间距离法 b ma c 四、例题 a 例1 已知5个大豆品种及一个指标(荚数/株),试用最短距离法聚类,其观测数据如表 x1 x2 x3 x4 x5 荚数/株 61 58.7 49.2 43.8 39.5 解:采用 表1 D0 G1 G2 G3 G4 G5 G1={x1} 0 G2={x2} 2.3 0 G3={x3} 11.8 9.5 0 G4={x4} 17.2 14.9 5.4 0 G5={x5} 21.5 19.2 9.7 4.3 0 表2 D1 G6={x1,x2} G3={x3} G4={x4} G5={x5} G6={x1,x2} 0 G3={x3} 9.5 0 G4={x4} 14.9 5.4 0 G5={x5} 19.2 9.7 4.3 0 表3 D2 G6={x1,x2} G3={x3} G7={x4,x5} G6={x1,x2} 0 G3={x3} 9.5 0 G7={x4,x5} 14.9 5.4 0 表4 D3 G6={x1,x2} G8={x4,x5,x3} G6={x1,x2} 0 G8={x4,x5,x3} 9.5 0 聚类表 分类数目 品种归类 距离系数 4 {x1,x2},{x3},{x4},{x5} 2.3 3 {x1,x2},{x3},{x4,x5} 4.3 2 {x1,x2},{x3,x4,x5} 5.4 1 {x1,x2,x3,x4,x5} 9.5 聚类图(谱系图) 例2 已知七个小麦品种及三个指标,试用最短距离法聚类,其观测数据如表: 单产(公斤/亩) 穗粒数(粒) 千粒重(克) x1 297.0 37.5 35.3 x2 312.5 39.5 37.5 x3 279.0 30.5 33.6 x4 332.5 35.2 36.2 x5 352.0 35.8 37.6 x6 382.0 29.3 40.9 x7 374.5 34.6 39.2 解:(1)数据模型,取对数lgx (2)计算品种间距离 采用欧氏距离公式: 单产 穗粒数 千粒重 x1 2.4728 1.5740 1.5478 x2 2.4949 1.6004 1.5740 x3 2.4456 1.4843 1.5263 x4 2.5218 1.5465 1.5587 x5 2.5465 1.5539 1.5752 x6 2.5820 1.4669 1.6117 x7 2.5735 1.5391 1.5933 (3)逐步聚类 表1: D0 G1 G2 G3 G4 G5 G6 G7 G1={x1} 0 G2={x2} 0.0433 0 G3={x3} 0.0962 0.1349 0 G4={x4} 0.0573 0.0622 0.1036 0 G5={x5} 0.0812 0.0695 0.1607 0.0306 0 G6={x6} 0.3712 0.1717 0.1614 0.1130 0.1008 0 G7={x7} 0.1159 0.1015 0.1504 0.0626 0.0357 0.0750 0 表2: D1 G1={x1} G2={x2} G3={x3} G8={x4.5} G6={x6} G7={x7} G1 0 G2 0.0433 0 G3 0

文档评论(0)

sfkl + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档