应用多元统计-6.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 可变法及MCQ法   7.可变法及McQuitty相似分析法(MCQ) 当Gp和Gq合并为Gr后,可变法把Gr与其他类Gk的类间距离的递推公式定义为(β1) 在cluster过程中使用β= 0时的递推公式 : 并把此方法称为McQuitty相似分析法. * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法 8. 离差平方和法(WARD) 离差平方和法是Ward(1936)提出的,也称为Ward法.它基于方差分析思想,如果类分得正确 ,则同类样品之间的离差平方和应当较小,不同类样品之间的离差平方和应当较大. * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法 k个类的总离差平方和为 当k固定时,要选择使W达到极小的分类. Wt ,Wt * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法  Ward法的基本思想是,先将n个样品各自成一类,此时W=0,然后每次将其中某两类合并为一类,因每缩小一类离差平方和就要增加,每次选择使W增加最小的两类进行合并,直至所有样品为一类为止. Ward法把两类合并后增加的离差平方和看成类间的平方距离,即把类Gp和Gq的平方距离定义为 * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法   比如:当G1={1,2},G2={4.5,6}时, W1 = (1-1.5)2+(2-1.5)2 = 0.25+0.25=0.5 W2 = (4.5-5.25)2+(6-5.25)2 = 0.5625+0.5625 = 1.125 记 G3={G1,G2}={1,2,4.5,6} ( 均值=3.375) W3 =(1-3.375)2+(2-3.375)2 +(4.5-3.375)2+(6-3.375)2 = 15.5865 则 D212 = W3 -(W1+W2 ) = 15.5865-(0.5+1.125) = 13.9615 或 D12 = 3.7365 * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法   下面来推导D2pq的公式.利用Wr的定义: * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法 经整理可得 当样品间距离采用欧氏距离时,上式可表为 这表明Ward法定义的类间距离与重心法只相差一个常数倍. * 第六章 §6.3 系统聚类方法 系统聚类分析的方法--- 离差平方和法   当Gp和Gq合并为Gr后,Gr与其他类Gk的距离有如下递推公式: 在实际应用中,离差平方和法应用比较广泛,分类效果较好.但它要求样品间距离必须采用欧氏距离. (习题6-8) * 第六章 §6.3 系统聚类方法 系统聚类方法的统一 以上介绍的八种方法聚类的步骤完全一样,所不同的是类与类之间的距离有不同的定义方法,因而得到不同的递推公式,Lance和Williams于1967年首先给出了统一公式.当Gp和Gq合并为Gr后,新类Gr与其他类Gk的平方距离为: 其中αp、αq、β和γ是参数,不同的系统聚类方法有不同的取值. * 第六章 §6.3 系统聚类方法 系统聚类方法的统一 * 第六章§6.4 系统聚类法的性质 系统聚类方法的简单性质    (1) 单调性 设Dk表示系统聚类法中第k次并类时的距离. 一个系统聚类法若能保证{Dk,k=1,2 ,…,n-1} 是单调的,则称它具有单调性. 如例6.3.1,用最短距离时有:D1=1, D2=1.5, D3=2, D4=2.5.满足D1≤D2 ≤ D3 ≤ D4 . 并类距离有单调性符合系统聚类法的基本思想 . 可以证明,最短距离法,最长距离法,类平均法,可变类平均法,离差平方和法都具有单调性, 只有重心法和中间距离法不具有单调性(习题6-4,6-5和6-6). * 第六章 §6.4 系统聚类法的性 系统聚类方法的简单性质    (2) 空间的浓缩与扩张 以例6.3.1来说明该性质.比较最短距离法和最长距离法的并类过程及相应的距离阵可以看出.每一步都有: Dij(短)≤Dij(长) (对一切i,j). 这种性质称为最长距离法比最短距离法扩张; 或称最短距离法比最长距离法浓缩. * 第六章 §6.4系统聚类法的性质 系

文档评论(0)

xiaohuer + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档