运用SPSS进行聚类分析和判别分析及因子分析.docVIP

下载本文档

32
0
约1.55万字
约 16页
2017-02-15 发布于重庆
举报
版权申诉

运用SPSS进行聚类分析和判别分析及因子分析.doc

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

运用SPSS进行聚类分析和判别分析及因子分析

《计量地理学》实验指导 §3．运用SPSS进行聚类分析和判别分析及因子分析一、利用SPSS软件实现聚类分析以第5章习题2为例说明运用SPSS实现聚类分析。在菜单中选择Classify==Hierarchical Cluster Analysis ，系统弹出线性回归对话框如下：图10 分层聚类分析对话框【Statistics钮】弹出Statistics对话框，选择Proximty matrix，要求显示欧氏不相识系数平方矩阵，点击Continue按钮返回Hierarchical Cluster Analysis对话框。【Plots钮】 Dendrogram 树型谱系图 Icicle 冰柱谱系图 Orientation 【Methods钮】有7种聚类方法供用户选择，8种形式的距离测量技术供用户选择，7种形式的原始数据标准化。选择聚类方法。单击Cluster Method框中的向下箭头按钮，展开聚类方法菜单。包括between-groups linkage:组间连接。合并两类中所有的，两两项对之间的平均距离最小。项对的两个成员分别属于不同的类。该方法中使用的是各对之间的距离，即非最大距离，也非最小距离。 within-groups linkage:组内连接。 nearest neighbor:最近邻法。 furthest neighbor:最远邻法。 centroid clustering:重心聚类法。 median clustering:中位数法。 Ward’s method:离差平方和法 8种距离： Squared Euclidean distance 平方欧氏距离 Euclidean distance 欧氏距离 Cosline 夹角余弦 Pearson Correlation 皮尔逊相关 Chebychev 切比雪夫距离 Block 绝对值 Minkowski 明考斯基 Customized 自定义选择标准化方法在Transform Values 栏的Standardize 标准化方法列表中选择。 None 不进行标准化 Z Scores 把数值标准化到Z分数 Ranges -1 to 1 把数值标准化到-1 到1的范围内 Maximum magnitude of 1 把数值标准化最大范围1 Ranges 0 to 1 把数值标准化到0到1的范围内 Mean of 1 把数值标准化到均值的范围内 Standard deviation of 1把数值标准化到单位标准差【Save钮】 None 表示不建立新变量 Single solution 生成一个新变量，表明每个个体聚类最后所属的类。可指定类数。 Range of solutions 指定范围内的结果。生成若干个新变量，表明聚为若干个类时，每个个体聚类后所属的类。输出解释选择标准差标准化处理原始数据，欧式距离计算各样本间的距离，采用最近距离聚类方法得到以下结果，最后使用Dendrogram树状谱系图和 Icicle冰状图加以显示。图11 聚类顺序图12 聚类冰柱图图13 聚类结果树状谱系图二、利用SPSS软件实现判别分析基本步骤 1、选择自变量及组变量 2、计算各组单变量的描述统计量 3、推导判别系数，给出标准化或未标准化的典则判别系数，并对函数显著性进行检验 4、建立Fisher线性判别函数 5、进行判别分组 6、进行样本回判分析，计算错分率 7、输出结果为研究舒张期血压和血浆胆固醇对冠心病的作用，某医师测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标，结果如表3所示，试作判别分析，建立判别函数以便在临床中用于筛选冠心病人。表3 冠心病人和正常人各项指标编号冠心病人组编号正常人组舒张压kPa x1 胆固醇mmol/L x2 舒张压kPa x1 胆固醇mmol/L x2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 9.86 13.33 14.66 9.33 12.80 10.66 10.66 13.33 13.33 13.33 12.00 14.66 13.33 12.80 13.33 5.18 3.73 3.89 7.10 5.49 4.09 4.45 3.63 5.96 5.70 6.19 4.01 4.01 3.63 5.96 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 10.66 12.