误差与分析课件 聚类与分析之谱系聚类法.pptVIP

误差与分析课件 聚类与分析之谱系聚类法.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!

类间距离及其递推公式 谱系聚类法的应用分析 引言 谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。 在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。 利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近性大小聚结起来的谱系图,再进一步根据实际情况确定合适的分类个数。 问题 判断两个样品最相似的依据是什么? 类间距离及其递推公式 常用的类间距离有四种: 最短距离 最长距离 类平均距离 重心距离 最短距离 以 分别表示样品 ,以 简记 与 的距离 ,设 分别表示两个类,它们分别含有 个样品.我们用 来表示类 与 之间的距离. 最长距离 重心距离 设类 中的样品为 , ,…, ,则其均值 按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类 由类 合并所得,则 包含 个样品. 为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,即计算类 与其他类 之间的距离. 常用的四种类间距离的递推公式 类平均距离 重心距离 (2) 选择 中主对角线以下(或以上)的最小距离,设这个元素是 ,这时 ,首先将 合并为一个新类 .在 中消去 , 所对应的行与列,并加入由新类 与剩下的其他未聚合的类间的距离所组成的一行和一列,得到一个更新的距离矩阵 ,它是 阶方阵. (3) 从 出发重复步骤(2)的做法得 ,再由 出发重复上述步骤,直到 个样品聚为一个大类为止. (4)在合并过程中要记下合并样品的编号及两类合并时的距离(称为距离水平),并绘制聚类谱系图. 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 谱系聚类法的应用分析 * 聚类分析之 --谱系聚类法 谱系聚类法的步骤 谱系聚类 谱系聚类 谱系聚类 谱系聚类 类间距离 谱系聚类 即用两类中样品之间距离最短者作为 两类间的距离. 谱系聚类 即用两类中样品之间距离最长者作为 这两类间的距离. 类平均距离 即用两类中所有两两样品之间的距离的平均 作为两类之间的距离. 或者 即用两类中所有两两样品之间的平方距离的平均 作为两类间的平方距离. 谱系聚类 称为类 的重心. 其中, , 分别是 的重心 ,即用两类的重心之间的距离作为两类间的距离. 谱系聚类 类间距离的递推公式 谱系聚类 最短距离 最长距离 谱系聚类 对于类平均距离的下列定义方式 同理可得递推公式如下: 谱系聚类 由 的合并集 的重心是 而 由 , 有 谱系聚类 若采用欧氏距离 的距离,以上介绍的4种类间距离的递推公式可统一表示为 计算样品之间 谱系聚类 各种类间距离的参数如下表所示 谱系聚类 谱系聚类法的步骤 (1) n个样品开始时作为n个类,计算两两之间的距离, 构成一个对称距离矩阵 此时, 谱系聚类 谱系聚类 核电企业对自身库存的优化管理 仓库内存货位置摆放的合适与否会直接影响到总搬运费用、大修工作效率以及仓库人员的工作积极性。因此将备品备件正确地分类存放是非常重要的。 应用谱系聚类法中的最短距离法对核电企业的备品备件进行分类, 然后根据分类的结果对这些类之间的关系做总结归纳。 谱系聚类 将备品备件大致分为以下几类: 机械类: 紧固件、密封、轴承、过滤器、压缩机、管道、 热交换器等; 电气类: 熔断器、断路器、变压

您可能关注的文档

文档评论(0)

mghkfg58 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档