聚类分析的spss实现.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用 SPSS 作聚类分析 以经济效益数据为例,用聚类分析法对各省市作分类 (见 spssex-4/ 全国各省市经济效益数据) 以城镇居民消费资料为例,用聚类分析法对各省市作分类 (见 spssex-4/ 城镇居民消费支出资料) SPSS 中的聚类分析 Spss 中的聚类功能常用的有两种: 快速聚类(迭代过程): K-Means Cluster 系统聚类: Hierarchical Cluster 一、 Hierarchical Cluster 聚类 系统聚类由两种方法:分解法和凝聚法。 系统聚类的功能:即可进行样品的聚类,也可 进行变量的聚类。 系统聚类的原理:即我们前面介绍过的系统聚 类方法的原理和过程。 系统聚类的中要进行以下的选择: 数据的标准化 测度方法的选择:距离方法的选择或相似性、关联程 度的选择。 聚类方法的选择:即以什么方法聚类, spss 中提供了 7 中方法可进行选择。 输出图形的选择:树形图或冰柱图。 系统聚类 见(一)聚类方法 见( 二)各种距离和相似系数 Method 聚类方法 标准化变换 亲疏关系指标 (一)聚类方法 1.Between-groups linkage 类间平均法 两类距离为两类元素两两之间平均平方距离 2.Within-groups linkage 类内平均法 两类距离为合并后类中可能元素两两之间平均平方距离 3.Nearest neighbor 最短距离法 4. Furthest neighbor 最长距离法 5.Centroid clustering 重心法 ( 欧式距离 ) 6.Median clustering 中间距离法 ( 欧式距离 ) 7.Ward Method 离差平方法 ( 欧式距离 ) 1.squared euclidean distance 平方欧式距离 2. euclidean distance 欧式距离 3.cosine 夹角余弦 (R 型 ) 4.pearson correlation 皮尔逊相关系数 (R) 5.chebychev 切比雪夫距离 ? ? ? ? ? ? ? i y x y x d i i 2 , ? ? ? ? ? ? ? i y x y x d i i 2 , ? ? y x Max y x d i i i ? ? , (二)各种距离和相似系数(亲疏关系指标) 6.block 绝对值距离 7.minkowski 明考斯基 8.customized ? ? ? ? ? ? ? ? ? ? ? i i i q y x y x d q 1 , ? ? ? ? ? ? ? ? ? ? ? i i i q y x y x d r 1 , ? ? ? ? ? i y x y x d i i , Statistics 聚类进度表 相似矩阵 样品或变量的 分类情况 Agglomeration Schedule 3 8 .466 0 0 4 14 15 .824 0 0 10 9 16 1.583 0 0 7 3 5 1.604 1 0 9 6 12 2.054 0 0 11 7 13 2.522 0 0 9 9 11 3.039 3 0 13 4 10 4.136 0 0 10 3 7 4.245 4 6 12 4 14 4.924 8 2 12 2 6 5.460 0 5 14 3 4 7.142 9 10 13 3 9 7.520 12 7 14 2 3 9.615 11 13 15 1 2 12.734 0 14 0 Stage 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Cluster 1 Cluster 2 Cluster Combined Coefficients Cluster 1 Cluster 2 Stage Cluster First Appears Next Stage 凝聚状态表的第一列表示聚类分析的第几步;第二 列、第三列表示本步聚类中哪两个样本或小类聚成一类; 第四列是相应的样本距离或小类距离;第五列、第六列表 明本步聚类中,参与聚类的是样本还是小类。 0 表示样本, 数字 n( 非 0 )表示由第 n 步聚类产生的小类参与本步聚类; 第七列表示本步聚类的结果将在下面聚类的第几步中用到。 Plot 树状结构图 冰柱图 冰柱的方向 Number of clusters Case X7 X5 X4 X3 X6 X8 X2 X1 1 X X X X X X X X X X X X X X X 2 X X X X X X X X X X X

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档