SPSS聚类和判别分析PPT.ppt

下载文档 降价啦

38
0
约1.34万字
约 77页
2018-01-25 发布于江苏
举报
版权申诉
保障服务

SPSS聚类和判别分析PPT.ppt

1、本文档共77页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

SPSS聚类和判别分析PPT

10.1主成分分析和因子分析简介 3 常用术语（1）因子载荷（2）变量共同度（3）公共因子的方差贡献 10.1主成分分析和因子分析简介 10.1.2主成分和公因子数量的确定（1）确定时遵循几个原则主成分的累积贡献率：一般来说，提取主成分的累积贡献率达到80%～85%以上就比较满意了，可以由此确定需要提取多少个主成分。 ? 特征值：特征值在某种程度上可以看成表示主成分影响力度大小的指标，如果特征值小于1，说明该主成分的解释力度还不如直接引入原变量的平均解释力度大。因此一般可以用特征值大于1作为纳入标准。 ? 综合判断：大量的实际情况表明，如果根据累积贡献率来确定主成分数往往较多，而用特征值来确定又往往较少，很多时候应当将两者结合起来，以综合确定合适的数量。 10.1主成分分析和因子分析简介 10.1.3 两者的区别与联系（1）两者都是在多个原始变量中通过它们之间的内部相关性来获得新的变量（主成分变量或因子变量），达到既能减少分析指标个数，又能概括原始指标主要信息的目的。（2）提取公因子主要有主成分分析法和公因子法，若采用主成分法，则主成分分析和因子分析基本等价。（3）因子分析提取的公因子比主成分分析提取的主成分更具有解释性。（4）两者分析的实质和重点不同。（5）两者的SPSS操作都是通过“分析→降维→因子分析”过程实现的，主成分分析不需要因子旋转，而因子分析需要经过旋转。 9.3 K-均值聚类第4步主要结果及分析：初始聚类中心表 Cluster 1 2 3 学习动机 40 67 77 学习态度 80 70 37 自我感觉 54 84 57 学习效果 44 69 100 迭代历史表由表可知，第一次迭代后，3个类的中心点分别变化了8.193，9.889和13.472。一共进行了10次迭代，达到聚类结果的要求（达到最大迭代次数），聚类分析结束。由于没有指定初始聚类中心，列出了由系统指定的类中心。与原数据比较，发现它们分别是第1、第6和第7号个案。迭代聚类中心内的更改 1 2 3 1 8.193 9.889 13.472 2 3.909 7.631 4.701 3 1.303 1.526 .672 4 .434 .305 .096 5 .145 .061 .014 6 .048 .012 .002 7 .016 .002 .000 8 .005 .000 3.996E-5 9 .002 9.768E-5 5.709E-6 10 .001 1.954E-5 8.155E-7 a. 迭代已停止，因为完成了最大次数的迭代。迭代无法收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 10。初始中心间的最小距离为 48.518。 9.3 K-均值聚类最终聚类中心表如第1类的学习动机值为39，学习态度值为77，自我感觉值为55，学习效果值为45。样本数情况可看出第1，2，3类中分别含有2，4，6个样本聚类 1 2 3 学习动机 39 52 76 学习态度 77 76 44 自我感觉 55 83 70 学习效果 45 67 91 聚类 1 2.000 2 4.000 3 6.000 有效 12.000 缺失 .000 9.3 K-均值聚类分类保存情况查看数据文件，可看到多出两个变量，分别表示每个个案的具体分类归属和与类中心的距离。主要内容 9.1 聚类与判别分析概述 9.2 二阶聚类 9.3 K-均值聚类 9.4 系统聚类 9.5 判别分析 9.4 系统聚类 9.4.1 基本概念与统计原理（1）基本概念系统聚类是效果最好且经常使用的方法之一，国内外对它进行了深入的研究，系统聚类在聚类过程中是按一定层次进行的。具体分成两种，分别是Q型聚类和R型聚类，Q型聚类是对样本（个案）进行的分类，它将具有共同特点的个案聚集在一起，以便对不同类的样本进行分析；R型聚类是对变量进行的聚类，它使具有共同特征的变量聚在一起，以便对不同类的变量进行分析。 9.4 系统聚类 9.4.1 基本概念与统计原理 (2) 统计原理系统聚类是根据个案或变量之间的亲疏程度，将最相似的对象聚集在一起。根据系统聚类过程的不同，又分为凝聚法和分解法两种。凝聚法的原理是将参与聚类的每个个案（或变量）视为一类，根据两类之间的距离或相似性，逐步合并直到合并为一个大类为止；分解法的原理是将所有个案（或变量）都视为一类，然后根据距离和相似性逐层分解，直到参与聚类的每个个案（或变量）自成一类为止。在层次聚类中，度量数据之间的亲疏程度是极为关键的。在衡量样本与样本之间的距离时，一般使用的距离有Eulcidean Distance、Squared Euclidean Dis