网站大量收购独家精品文档,联系QQ:2885784924

聚类分析的SPSS实现选编.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析的SPSS实现选编

用SPSS作聚类分析;SPSS中的聚类分析;一、Hierarchical Cluster聚类;系统聚类的中要进行以下的选择: 数据的标准化 测度方法的选择:距离方法的选择或相似性、关联程度的选择。 聚类方法的选择:即以什么方法聚类,spss中提供了7中方法可进行选择。 输出图形的选择:树形图或冰柱图。 ;系统聚类 ;;Method;(一)聚类方法 1.Between-groups linkage 类间平均法 两类距离为两类元素两两之间平均平方距离 2.Within-groups linkage 类内平均法 两类距离为合并后类中可能元素两两之间平均平方距离 3.Nearest neighbor 最短距离法 4. Furthest neighbor 最长距离法 5.Centroid clustering 重心法 (欧式距离) 6.Median clustering 中间距离法 (欧式距离) 7.Ward Method 离差平方法 (欧式距离) ; 1.squared euclidean distance 平方欧式距离 2. euclidean distance 欧式距离 3.cosine 夹角余弦(R型) 4.pearson correlation 皮尔逊相关系数(R) 5.chebychev 切比雪夫距离;6.block 绝对值距离 7.minkowski 明考斯基 8.customized ;;Statistics;; 凝聚状态表的第一列表示聚类分析的第几步;第二列、第三列表示本步聚类中哪两个样本或小类聚成一类;第四列是相应的样本距离或小类距离;第五列、第六列表明本步聚类中,参与聚类的是样本还是小类。0表示样本,数字n(非0)表示由第n步聚类产生的小类参与本步聚类;第七列表示本步聚类的结果将在下面聚类的第几步中用到。;;Plot;Number of clusters; 冰柱图因其样子非常象冬天房顶垂下的冰柱得名,它以图形的方式显示层次聚类分析结果,一般从冰柱图的最后一行开始观察,第一列表示类数。两样品之间的“х”表示将其两边的样品(类)联结起来聚成新类。;;应用举例:; 首先对表4-1中的原始数据进行标准化变换处理,经过运算使数据标准化得到表4-2,使它的每列数据的平均值为0,方差为1,这样表4-1中5列具有不同量纲、不同数量级的数据;;;表4-1;;表 4-2;;;K-Means Cluster聚类;K-Means Cluster原理;K-Means Cluster聚类过程;例 饮料数据(spssex/drink.sav ); 快速聚类;选项;快速聚类法的聚类数由用户指定,分类是唯一的。 1.分类数:如希望聚成K类 2.聚类方法:method: iterate and clussify(聚类分析的 clussify only(聚类分析过程类中心 3.聚类中心:centers 4.迭代次数:iterate 5.保存分类结果:save;Initial Cluster Center:快速聚类的初始类中心点(本例由系统自行指定四个类的初始类中心点);Iteration History:快速聚类的迭代步骤 在迭代过程中,完成第一次迭代后形成的四个新类中心点距初始类中心点的欧氏距离分别为5.065、12.532、12.275、25.901。第四次迭代后形成的四个新类中心点几乎与上次确定的中心点没有差别。经过四次迭代,快速聚类完成。;快速聚类的最终类中心点;Number of Cases in each Cluster:快速聚 类的最终结果

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档