- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
四、中间距离法 最长距离 最短距离 中间距离 中间距离法的递推公式 若在某步聚类中将类p与q合并为类r,则任一类k与新类r的距离: 当β=-0.25时,为三角形中线: 五、重心法(Centroid clustering): 含义: 两类间的距离定义为两类重心(均值点)之间的的距离 ? ? 例题:数据如前 样品间距离为欧氏距离时的递推公式 Gr Gt 重心法虽有较好的代表性,但并未充分利用各个样品的信息.比如下面两组类按重心法类间距离相等,这是不合理的. 六、类平均法(Between-group Linkage) 含义:类间距离为所有样品对间的平均距离。 ? ? ? ? ? ? 利用了所有样品对距离的信息 类与类之间的距离平方为两类样品两两之间的距离平方的平均,即 类平均法的类间距离: 合并新类的距离递推公式: 设某一步将Gp和Gq合并成Gr,它们所包含的样品个数分别为np ,nq和nr(nr=np+nq).Gr与其他类Gk的类间距离的递推公式为 七.离差平方和法 (Ward’s method ) 类似于方差分析的想法,如果类分得恰当,同类内的样品之间的离差平方和应较小,而类间的离差平方和应当较大。 其中 是由Gp和Gq合并成的Gr类的类内离差平方和。可以证明离差平方和法的类间递推公式为 例题:数据如前 八、系统聚类法的软件实现——SPSS 以教材88页例题1为例,SPSS处理: 1、Analyze-Classify-Hierarchical Cluster 2、把dxbz、czbz、wmbz选入Variables 3、若对样品聚类(Q型聚类):在Cluster选Cases; 若对变量聚类(R型聚类)则在Cluster选Variables 4、选Plots,再点Dendrogram,则画出树状图; 若点Icicle,则画出冰挂图,其中Orientation中(Vertical为纵向冰挂图;Horizontal为横向冰挂图)。 …….. 九、 系统聚类法的基本性质 (一) 单调性 在聚类分析过程中,并类距离分别为l k(k=1,2,3,…?)若满足 ,则称该聚类方法具有单调性。可以证明除了重心法和中间距离法之外,其他的系统聚类法均满足单调性的条件。 (二)空间的浓缩和扩张 1、定义矩阵的大小 设同阶矩阵D(A)和D(B),如果D(A)的每一个元素 小于D(B)的每一个元素,则记为 。 2、空间的浓缩和扩张 设有两种系统聚类法A和B,他们在第i步的距离矩阵分别为Ai和Bi(I=1,2,3…),若AiBi ,则称第一种方法A比第二种方法B使空间扩张,或第二种方法比第一种方法浓缩。 3、方法的比较 D(短) D(平),D(重) D(平); D(长) D(平); 当 ,D(变平) D(平); 当 ,D(变平) D(平)。 1.由适当的阈值确定 介绍系统聚类法的基本步骤时,由谱系聚类图及临界值,即可给出分类结果. 2.根据数据点的散布图直观地确定类的个数 3.根据谱系图确定分类个数的准则 4.根据统计量确定分类个数 十、确定类个数的几种常见方法: 黛米尔曼(Demirmen,1972)提出依据树状结构图分类的准则: 由 Rk2的定义 可知 , Rk2值越大,也就是Pk/T越小,表示k个类内离差平方和之和Pk在总离差平方和T中占的比例越小,这说明k个类区分得越开. Rk2的值总是在0和1之间,而且Rk2的值总是随着分类个数k的减少而变小 十一、聚类效果评价统计量 所以我们只能取合适的K,使得R2足够大,而K本身较小,且随着K的增加, R2的增幅不大。 1、Rk2统计量 用于评价聚为K个类的效果。如果聚类的效果好,类间的离差平方和相对于类内的离差平方和应比较大,所以应该取伪F统计量较大而类数较小的聚类水平。 2.伪F统计量 其中WK和WL分别是类K、L的类内离差平方和,BKL是将K和L合并为第M类所增加离差平方和 BKL = WM - WK - WL 为合并导致的类内离差平方和的增量。用它评价合并第K和L类的效果,伪 统计量大说明不应该合并这两类,应该取合并前的水平。 3.伪 统计量 §2.5 非系统聚类法简介 动态聚类法:也
您可能关注的文档
- chapter7 图要点.ppt
- Chapter9 模式识别--神经网络要点.ppt
- Check+Point防火墙设备故障处理指导手册+V2.0要点.doc
- Chapter_3_Alkanes要点.ppt
- Chapter2AutomobileComponents′English要点.ppt
- CII表全部1-56要点.doc
- chapter09女性生殖系统要点.ppt
- Chp01质点运动学要点.ppt
- CISP-网络安全应用-new要点.ppt
- CISCO控制器无线AP配置方法要点.ppt
- 浙江省温州市浙南名校联盟2025-2026学年高一上学期期中联考数学试题含解析.docx
- 26高考数学提分秘诀重难点34圆锥曲线中的定点、定值、定直线问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点35概率与统计的综合问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点31圆锥曲线中的切线与切点弦问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点30圆锥曲线中的弦长问题与长度和、差、商、积问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点29巧解圆锥曲线的离心率问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点28直线与圆的综合(举一反三专项训练)(全国通用)(含解析).docx
- 寡核苷酸药物重复给药毒性研究技术指南.docx
- 重组溶瘤腺病毒生产质量管理标准.docx
- 26高考数学提分秘诀重难点27直线与圆中常考的最值与范围问题(举一反三专项训练)(全国通用)(含解析).docx
最近下载
- 数字经济环境下制造业创新系统协同演化研究.pdf VIP
- 2025年拍卖师应对竞买人提出的“拍卖无效”或“撤销拍卖”诉求的现场处置专题试卷及解析.pdf VIP
- T_CABC+15—2025_古树香榧质量追溯导则.pdf VIP
- 《铁路职业素质》课件 1中国铁路精神.pptx VIP
- 2025年金融风险管理师交易对手信用风险在市场压力下的情景分析专题试卷及解析.pdf VIP
- 2025年金融风险管理师远期启动利率互换定价专题试卷及解析.pdf VIP
- 2025年金融风险管理师股票市场指数与通货膨胀关系专题试卷及解析.pdf VIP
- 专题4.32 一次函数(中考常考点分类专题)(提升篇)-2023-2024学年八年级数学上册基础知识专项突破讲与练(北师大版).docx VIP
- 2025年拍卖师拍卖监督中的国际协作专题试卷及解析.pdf VIP
- (课件)-煤矿瓦斯抽采达标暂行规定.ppt VIP
原创力文档


文档评论(0)