层次聚类分析祥解.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
层次聚类分析祥解.ppt

层次聚类的基本性质 1、单调性 设Dk是层次聚类法中第K次并类时的距离,如果 D1 D2 … ,则称并类距离具有单调性。 可以证明除了中间距离法和重心法之外,其他的层次聚类法均满足单调性的条件。 2、空间的浓缩或扩张 两个同阶矩阵D(A)和D(B),如果D(A)的每一个元素不小于D(B)的相应元素,则记为 D(A)≧D(B)。 若有两种层次聚类法A和B,在第K步的距离矩阵记为 D(AK)和D(BK), 若有D(AK) ≧ D(BK)对所有K,则称A比B使空间扩张或B比A使空间浓缩。 D(0) G1 G2 G3 G4 G5 G1={X1} 0 G2={X2} 3 0 G3={X3} 4 1 0 G4={X4} 6 3 2 0 G5={X5} 10 7 6 2 0 最短距离法 最长距离法 D(1) G6 G3 G4 G5 G6 0 G3 3 0 G4 2 6 0 G5 6 10 4 0 D(1) G6 G3 G4 G5 G6 0 G3 4 0 G4 3 6 0 G5 7 10 4 0 最短距离法 最长距离法 最长距离法 最短距离法 D(2) G7 G4 G5 G7 0 G4 3 0 G5 4 10 0 D(2) G6 G7 G3 G6 0 G7 6 0 G3 7 10 0 最长距离法 最短距离法 D(3) G7 G8 G7 0 G8 4 0 D(3) G7 G8 G7 0 G8 10 0 D(短) D(平), D(重) D(平); D(长) D(平); 当 , D(变平) D(平); 当 , D(变平) D(平)。 D(离) D(平) 确定类的个数 在聚类分析过程中类的个数如何来确定才合适呢?这是一个十分困难的问题,人们至今仍未找到令人满意的方法。但是这个问题又是不可回避的。下面我们介绍几种方法。 1、给定阈值——通过观测聚类图,给出一个合适的阈值T。要求类与类之间的距离不要超过T值。例如我们给定T=0.35,当聚类时,类间的距离已经超过了0.35,则聚类结束。 总离差平方和的分解(准备知识) 如果这些样品被分成两类 可以证明: 总离差平方和 =组内离差平方和+组间离差平方和 令T为总离差平方和 令PG为分为G类的组内离差平方和 2、统计量 其中T是数据的总离差平方和, 是组内离差平方和。 比较大,说明分G个类时类内的离差平方和比较小,也就是说分G类是合适的。但是,分类越多,每个类的类内的离差平方和就越小, 也就越大;所以我们只能取合适的G,使得 足够大,而G本生很小,随着G的增加, 的增幅不大。比如,假定分4类时, =0.8;下一次合并分三类时,下降了许多, =0.32,则分4 类是合适的。 3、伪F统计量的定义为 伪F统计量用于评价聚为G类的效果。如果聚类的效果好,类间的离差平方和相对于类内的离差平方和大,所以应该取伪F统计量较大而类数较小的聚类水平。 4、伪 统计量的定义为 其中 和 分别是的类内离差平方和, 是将K和L合并为第M类的离差平方和 = - - 为合并导致的类内离差平方和的增量。用它 评价合并第K和L类的效果,伪 统计量大说 明不应该合并这两类,应该取合并前的水平。 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * D2(2) G7

文档评论(0)

love + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档