- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统4计学课件
第四章 聚类分析 基本思想 聚类分析和判别分析的区别 §4.1 分类统计量 分类统计量 4.1.1 样品间的“相似性”度量—距离 1.明考斯基(Minkowski)距离(明氏距离) 2.绝对距离(m=1) 3.欧氏距离(m=2) 4.切比雪夫(Chebychev)距离(m=∞) 数据的标准化方法 标准化方法 5.方差加权距离 6.马氏(Mahalanobis)距离 例4.1.1 表4.1.1 选择适用的距离 表4.1.2 4.1.2 变量间的“关联性”度量—相似系数 1.夹角余弦 2.相关系数 §4.2 谱系聚类法 4.2.1 类与类之间的距离 1.最短距离 2.最长距离 3.类平均距离 类平均距离 4.2.2 谱系聚类法 谱系聚类法 例4.2.1 例 例 1.最短距离法 最短距离法 最短距离法 最短距离法 谱系图 阈值 2.最长距离法 最长距离法 最长距离法 最长距离法 3.类平均法 类平均法 类平均法 类平均法 类平均法 不同聚类方法的聚类结果一般是不同的 SPSS判别分析的主要步骤 (1)输入数据 (2)依次单击Analyze→Classify→Hierarchical cluster (3)聚类分析主对话框 (4) 在 Hierarchical Cluster Analysis 对话框中输入分析变量和标识变量 (5)Statistics选项 Statistics 对话框 (6)Plots 选项 Plots 对话框 (7)Measure选项 (8)Cluster Method选项 Method 对话框 (9)欧氏距离矩阵 (10)聚类的凝聚过程表 (11)冰柱图 (12)树形图 例4.2.2 最短距离法 最长距离法 二 点说明 例4.2.3 1. 最短距离法: 最短距离法 (ⅲ)最短距离法 2. 最长距离法 3. 类平均法 §4.3 模糊聚类法 4.3.1 模糊聚类的基本概念 1.特征函数 2.隶属函数与模糊集 3.模糊矩阵及其褶积 例: 4.模糊等价矩阵及其λ- 截矩阵 λ- 截矩阵 例 4.3.2 模糊聚类方法 2.变换为模糊矩阵 3.建立模糊等价矩阵 4.聚类 例4.3.1 例 (ⅰ) (ⅱ) (ⅲ) (ⅳ) (ⅴ) (续例4.1.1) 根据例4.1.1给出的11种欧洲语言的距离矩阵, 分别采用最短距离法, 最长距离法和类平均法进行聚类。 根据距离矩阵, 挪威语(N)和丹麦语(Da),以及法语(Fr)与意大利语(I)和西班牙语(S)与意大利(I)之间的距离(均为1)最小, 即 对于各种聚类方法, 都首先在水平1上合并(即挪威语和丹麦语)为一个新类。但由于法语与西班牙语之间的距离为2, 即 因此不能把 (即法语, 西班牙语和意大利语)合并为一类, 而只能合并 与 , 或 与 为一个新类。这里选择合并 与 为一个新类, 然后再按不同的聚类方法作聚类分析,得聚类谱系图(见图4.2.4, 图4.2.5和图4.2.6)。 采用最短距离法的聚类过程为: (ⅰ)首先在水平1上合并挪威语(N)和丹麦语(Da)为新类, 以及合并法语(Fr)与意大利语(I)为新类。 (ⅱ)然后在水平2上把英语(E)并入挪威语—丹麦语的类中, 西班牙语(S)并入法语—意大利语的类中。 (ⅲ)而在水平5上合并荷兰语(Du)与德语(G)为新类, 同时把波兰语(P)并入法语—意大利语—西班牙语的类中。 (ⅳ)在水平7上,合并英语—挪威语—丹麦语和法语—意大利语—西班牙语—波兰语。 (ⅴ)在水平8上,合并匈牙利语和芬兰语。 (ⅵ)最后, 合成一类。 采用最长距离法的聚类过程为: (ⅰ) 与最短距离法相同, 在水平1上合并挪威语(N)和丹麦语(Da),以及法语(Fr)与意大利语(I)为新类。然后在水平2上把英语(E)并入挪威语—丹麦语的类中,把西班牙语(S)并入法语—意大利语的类中。 并仍在水平5上把波兰语(P)并入法语—意大利语—西班牙语的类中。 (ⅱ)与最短距离法不同的是在水平6上把德语(G)并入英语—挪威语—丹麦语的类中,在水平7上把荷兰语(Du)与英语—挪威语—丹麦语—德语类和法语—意大利语—西班牙语—波兰语合并成一类。并在最后由两类合并成一个大类, 而最短距离法由三类合并成一大类。 采用类平均法的聚类结果与最长距离法较为相近。 由于不同聚类法所采用的类与类之间距离的定义不同, 一般会得到不同的聚类结果。 (1)对于一个具体问题, 可采用几种不同的距离(或相似系数)及聚类方法进行聚类。如
原创力文档


文档评论(0)