运用SPSS进行聚类分析和判别分析及因子分析.docVIP

运用SPSS进行聚类分析和判别分析及因子分析.doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运用SPSS进行聚类分析和判别分析及因子分析

《计量地理学》实验指导 §3.运用SPSS进行聚类分析和判别分析及因子分析 一、利用SPSS软件实现聚类分析 以第5章习题2为例说明运用SPSS实现聚类分析。 在菜单中选择Classify==Hierarchical Cluster Analysis ,系统弹出线性回归对话框如下: 图10 分层聚类分析对话框 【Statistics钮】 弹出Statistics对话框,选择Proximty matrix,要求显示欧氏不相识系数平方矩阵,点击Continue按钮返回Hierarchical Cluster Analysis对话框。 【Plots钮】 Dendrogram 树型谱系图 Icicle 冰柱谱系图 Orientation 【Methods钮】 有7种聚类方法供用户选择,8种形式的距离测量技术供用户选择,7种形式的原始数据标准化。 选择聚类方法。单击Cluster Method框中的向下箭头按钮,展开聚类方法菜单。包括between-groups linkage:组间连接。合并两类中所有的,两两项对之间的平均距离最小。项对的两个成员分别属于不同的类。该方法中使用的是各对之间的距离,即非最大距离,也非最小距离。 within-groups linkage:组内连接。 nearest neighbor:最近邻法。 furthest neighbor:最远邻法。 centroid clustering:重心聚类法。 median clustering:中位数法。 Ward’s method:离差平方和法 8种距离: Squared Euclidean distance 平方欧氏距离 Euclidean distance 欧氏距离 Cosline 夹角余弦 Pearson Correlation 皮尔逊相关 Chebychev 切比雪夫距离 Block 绝对值 Minkowski 明考斯基 Customized 自定义 选择标准化方法 在Transform Values 栏的Standardize 标准化方法列表中选择。 None 不进行标准化 Z Scores 把数值标准化到Z分数 Ranges -1 to 1 把数值标准化到-1 到1的范围内 Maximum magnitude of 1 把数值标准化最大范围1 Ranges 0 to 1 把数值标准化到0到1的范围内 Mean of 1 把数值标准化到均值的范围内 Standard deviation of 1把数值标准化到单位标准差 【Save钮】 None 表示不建立新变量 Single solution 生成一个新变量,表明每个个体聚类最后所属的类。可指定类数。 Range of solutions 指定范围内的结果。生成若干个新变量,表明聚为若干个类时,每个个体聚类后所属的类。 输出解释 选择标准差标准化处理原始数据,欧式距离计算各样本间的距离,采用最近距离聚类方法得到以下结果,最后使用Dendrogram树状谱系图和 Icicle冰状图加以显示。 图11 聚类顺序 图12 聚类冰柱图 图13 聚类结果树状谱系图 二、利用SPSS软件实现判别分析 基本步骤 1、选择自变量及组变量 2、计算各组单变量的描述统计量 3、推导判别系数,给出标准化或未标准化的典则判别系数,并对函数显著性进行检验 4、建立Fisher线性判别函数 5、进行判别分组 6、进行样本回判分析,计算错分率 7、输出结果 为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如表3所示,试作判别分析,建立判别函数以便在临床中用于筛选冠心病人。 表3 冠心病人和正常人各项指标 编号 冠心病人组 编号 正常人组 舒张压kPa x1 胆固醇mmol/L x2 舒张压kPa x1 胆固醇mmol/L x2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 9.86 13.33 14.66 9.33 12.80 10.66 10.66 13.33 13.33 13.33 12.00 14.66 13.33 12.80 13.33 5.18 3.73 3.89 7.10 5.49 4.09 4.45 3.63 5.96 5.70 6.19 4.01 4.01 3.63 5.96 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 10.66 12.

文档评论(0)

xingkongwd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档