第九章SPSS的聚类分析-学生.pptVIP

下载本文档

14
0
约6.13千字
约 38页
2016-09-08 发布于浙江
举报
版权申诉

第九章SPSS的聚类分析-学生.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第九章SPSS的聚类分析-学生,spss聚类分析,spss聚类分析步骤,spss聚类分析案例,spss聚类分析结果解释,spss聚类分析树状图,spss做聚类分析,spss系统聚类分析步骤,spss聚类分析教程,spss系统聚类分析

K-means快速聚类 (三)基本操作步骤 A.菜单选项:analyze-classify-k means cluster B.选定参加快速聚类分析的变量到variables框 C.确定快速聚类的类数(number of clusters).类数应小于个案总数 D.选择聚类方法(method)：默认iterate and classify，即：在聚类的每一步都重新计算新的类中心 E.确定聚类终止条件（iterate) K-means快速聚类 (四)其他 1. 保存快速聚类的结果(save) cluster membership:将各个案所属类的类号保存到qcl_1变量中 distance from cluster center:将各样本距所属类中心的距离保存到qcl_2变量中. K-means快速聚类 (四)其他 2.输出选项(option) initial cluster centers:输出初始类中心点 ANOVA table:输出各类的方差分析表 cluster information for each case:输出每个样本的分类结果和距离 K-means快速聚类 (四)其他 3. use running means项: 选中：表示每个样本被分配到一类后立即计算新的类中心。聚类结果与个案的先后次序有关. 不选中：表示完成了所有个案的依次分配后再计算类中心。省时。 K-means快速聚类 (四)其他 4.用户指定类中心(center) read initial from:若不指定则系统自动确定初始类中心。指定则从某.sav文件中读入初始类中心数据（应设一个名为Cluster_的变量名）。 Write final as:在分析的最后将各类中心写入某.sav文件聚类分析其他 (一)聚类解的可信性(一般性) 如果一个聚类解重复出现在从同一总体抽出的不同样本中,则以认为该聚类解具有可信性样本分成两组分别聚类比较. 对同一批数据采用不同的方法反复聚类聚类分析其他 (二)聚类方法的选择没有明确答案层次聚类方法易受异常值的影响.应尽量剔除异常值对聚类结果的影响快速聚类方法受异常值的影响较小,对不合适的初始分类能够迭代调整两种聚类方法结合使用. 通过小规模分层聚类确定分类数目,为快速聚类提供帮助; 通过反复的分层聚类,发现并排除异常值; 通过快速聚类进行大规模聚类 * * 1 - * 第九章 SPSS的聚类分析聚类分析概述 (一)概念 (1)聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法. 例如：细分市场、消费行为划分聚类分析是建立一种分类，是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大. 聚类分析概述两类:(001 002) (003 004 005) 三类:(001 002) (003) (004 005) (2)例如聚类分析概述 (3)总结上述分类的原则:依据学生成绩的差距,差距较小的为一类分类过程中,没有事先指定分类的标准.完全根据样本数据客观产生分类结果. (4)SPSS中的聚类方法分层聚类 K-MEANS快速聚类聚类分析概述（二）特点聚类分析前所有个体所属的类别是未知的，类别个数一般也是未知的，分析的依据只有原始数据，可能事先没有任何有关类别的信息可参考严格地，聚类分析并不是纯粹的统计技术，不象其他多元分析，需要从样本去推断总体一般不涉及统计量分布，也不需显著性检验聚类分析更象是一种建立假设的方法，而对相关假设的检验还需要借助其他统计方法聚类分析概述（三）注意聚类分析主要用于探索性研究，其分析结果可提供多个可能的解，最终解的选择需要研究者的主观判断和后续分析聚类分析的解完全依赖于研究者所选择的聚类变量，增加或删除一些变量对最终解都可能产生实质性的影响不管实际数据中是否存在不同的类别，利用聚类分析都能得到分成若干类别的解分层聚类 (一)思路:聚类过程具有一定的层次性以合并(凝聚)的方式聚类(SPSS采用) 首先,每个个体自成一类其次,将最“亲密”的个体聚成一小类然后,将最“亲密”的小类或个体再聚成一类重复上述过程,即：把所有的个体和小类聚集成越来越大的类，直到所有的个体都到一起(一大类)为止可见,随着聚类的进行,类内的“亲密”性在逐渐减低 ——一旦个案（变量）被聚为一类，以后分类结果不会改变分层聚类 (一)思路以分解的方式聚类首先,所有个体都属于一类其次,将大类中最“疏远”的小类或个体分离出去然后,分别将小类中最“疏远”的小类或个体再分离出去重复上述过程,即：把类分解成越来越小的小类，直到所有的个体自成一类为止可见,随着聚类的进行,类