网站大量收购独家精品文档,联系QQ:2885784924

SPSS分析软件.pptVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSS分析软件.ppt

基于SPSS分析软件开展聚类分析 * * 个体与小类、小类与小类间“亲密程度”的度量方法: 个体间距离的度量方法: 1.最近邻居(nearest neighbor)距离 个体于小类间的最近邻居距离是该个体小类中每个个体距离的最小值 个体与小类、小类与小类间“亲密程度”的度量方法: 个体间距离的度量方法: 2.最远邻居(furthest neighbor)距离 个体与小类间的最远距离是该个体与小类中每个个体距离的最大值 个体与小类、小类与小类间“亲密程度”的度量方法: 个体间距离的度量方法: 3.组间平均链锁(between-groups linkage)距离 个体与小类间的组间平均链锁距离是该个体与小类中每个个体距离的平均值。 个体与小类、小类与小类间“亲密程度”的度量方法: 个体间距离的度量方法: 4.组内平均链锁(within-groups linkage)距离 个体与小类间的组内平均链锁距离是该个体与小类中每个个体距离以及小类内各个体间距离的平均值。 个体与小类、小类与小类间“亲密程度”的度量方法: 个体间距离的度量方法: 5.重心(centroid clustering)距离 个体与小类间的重心距离是该个体与小类的重心点的距离。 个体与小类、小类与小类间“亲密程度”的度量方法: 个体间距离的度量方法: 6.离方差平方和法 原则是,聚类过程中使小类内离差平方和增加最小的两小类应首先合并为一类。 如果参与聚类分析的变量存在数量级上的差异,应在“转换值”选项中选择消除数量级的方法: 例:1 2 5 8 12 None:表示不进行任何处理 Z:表示计算Z分数,它将各变量值减去均值后除以标准差。标准化后的变量值平均值为0,标准差为1 Range -1to1:表示将各变量值除以全距,处理以后的变量值的范围在-1~1之间。该方法适于变量值中有负值的变量。 Range 0 to1:表示将各变量值减去最小值后除以全距。处理以后的变量值的范围在0~1之间。 Maximum magnitude of 1:表示将各变量值除以最大值。处理以后的变量值的最大值为1 Mean of 1:表示各变量值除以均值 Standard deviation of 1:表示将各变量值除以标准差 定距型变量个体间距离的计算方式 1.欧氏距离(euclidean distance) 2.平方欧式距离(squared euclidean distance) 3.切比雪夫(chebychev)距离 描述:两个体K个变量值绝对差的最大值 4.Block距离 描述:两个体K个变量值绝对差的总和 5.明考斯基(minkowski)距离 6.夹角余弦( cosine)距离 7.用户自定义(customized)距离 计数变量个体间距离的计算方式(非连续变量) 1.卡方距离(chi-square measure) 2.Phi方距离(phi-square measure) 二值变量个体间距离的计算方式 1.简单匹配系数(simple matching) 2.雅科比系数(jaccard) 应用聚类分析方法应注意以下几点: 1.所选择的变量应符合聚类的要求 聚类分析是在所选变量的基础上对样本数据进行分类,因此分类结果是各个变量综合计量的结果。在选择参与聚类分析的变量时,应注意所选的变量是否符合聚类的要求。 2.各变量的变量值不应有数量级上的差异 聚类分析是以各种距离来度量个体间的“亲疏”程度。从上述各种距离的定义来看,数量级将对距离产生较大的影响,并影响最终的聚类结果。 消除数量级的方法较多,其中标准化处理是最常用的方法 3.各变量间不应该有较强的线性关系 聚类分析是以各种距离来度量个体间的“亲疏”程度的。从各种距离的定义来看,所选择的每个变量都会在距离中作出“贡献”。如果所选变量之间存在较高的线性关系,能够相互替代,那么计算距离时同类变量将重复“贡献”,将在距离中有较高的权重,因而使得最终的聚类结果偏向该类变量 *

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档