心理统计SPSS-第八章聚类分析原理及操作.pptVIP

下载本文档

14
0
约4.51千字
约 23页
2017-09-07 发布于江西
举报
版权申诉

心理统计SPSS-第八章聚类分析原理及操作.ppt

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

心理统计SPSS-第八章聚类分析原理及操作

第八章聚类分析的原理及操作 “物以类聚, 人以群分” ，科学研究在揭示对象特点及其相互作用的过程中, 不惜花费时间和精力进行对象分类，以揭示其中相同和不相同的特征。在心理学研究中, 经常遇到的分类包括两种情况：一是对研究样本或个案的分类, 即根据每个个案的一系列观测指标，将那些在这些观测量方面表现相近的个案归为一类, 将那些在这些观测量方面的表现很不相同的个案归为不同类；二是对观测量的分类，即将一系列的观测量归类合并为性质明显不同的少数几个方面。一、聚类分析的基本原理进行聚类分析，要先建立由某些事物属性构成的指标体系，或者说是一个变量组合。入选的每个指标必须能刻画事物属性的某个侧面，所有指标组合起来形成一个完备的指标体系，它们互相配合可以共同刻画事物的特征。所谓完备的指标体系，是说入选的指标是充分的，其他任何新增变量对辨别事物差异无显著性贡献。如果所选指标不完备，则导致分类偏差。比如要对家庭教养方式进行分类，就要有描述家庭教育方式的一系列变量，这些变量能够充分地反映不同家庭对子女的教养方式。简单地说，聚类分析的结果取决于变量的选择和变量值获取的两个方面。变量选择越准确、测量越可靠，得到的分类结果越是能描述事物各类间的本质区别。距离或相似性程度是聚类分析的基础。点距如何计算呢？拿连续测量的变量来说，可以用欧氏距离平方计算：即各变量差值的平方和。 1. 聚类分析的前期准备工作聚类分析是以完备的数据文件为基础的，一般还要求各个观测变量的量纲一致，即各变量取值的数量级一致。所以，聚类分析前要检查各变量的量纲是否一致，不一致则需进行转换，如将各变量均作标准化转换就可保证量纲一致。 2. 聚类分析的主要方法聚类分析层次聚类分析快算聚类分析： Q聚类分析： R聚类分析：使用有共同特征的样本聚齐在一起，以便对不同类的样本进行分析。对研究对象的观察变量进行分类，它使具有共同变化特征的变量(相关性高)聚集在一起。用户指定类别数的大样本资料的逐步聚类分析，其实质是K-Mean聚类，它先对数据进行初始分类，然后逐步调整，得到最终分类。 3. 聚类分析图形表示(p174) 例如，根据某一观测指标体系对6个个案进行聚类分析，已经知道指标体系中的变量均为连续变化的数据，所以采用欧氏距离测量个体与个体之间，小类与小类之间的距离，最先计算出来的个案间距离矩阵如表1。表1 G（2） G（3） G（4） G（5） G（6） G（1） 2 5 3 7 8 G（2） 4 5 6 9 G（3） 7 7 9 G（4） 3 4 G（5） 6 凝聚状态表依据距离最近原则，表1中个案1与个案2首先聚合在一起形成小类G（1,2），再以该小类，其他四个个体见距离计算距离矩阵，小类间或小类与个体间距离采用平均连锁法计算距离。如表2所示表2 G（3） G（4） G（5） G（6） G（1，2） 5 5 7 8 G（3） 7 7 9 G（4） 4 G（5） 6 根据表2所示，个案4与个案5聚合在一起形成小类G（4,5）。再以两个小类、两个个案计算距离矩阵，如表3 表3 G（3） G（4,5） G（6） G（1,2） 5 6 7 G（3） 8 9 G（4,5） 5 表4 G（4,5,6） G（1,2,3） 7 根据表3所示，个案3与小类G（1,2）聚合在一起形成小类G（1,2,3）,个案6与小类G（4,5）聚合在一起形成小类G（4,5,6）,再计算小类间的距离，如表所示。凝聚状态表表格形式(p175) 聚合阶段相互聚合的小类形成小类后再参与聚合的下一阶段类1 类2 1 1 2 3 2 4 5 4 3 2 3 5 4 4 6 5 5 1 3 0 上述过程可以用一个表格加以呈现：第一阶段，个案1和个案2凝聚成一个小类；第二阶段，个案4和5凝聚成一个小类；第三阶段，个案3和第一阶段形成的小类凝聚成一个小类；第四阶段，个案6与第二阶段形成的小类凝聚；第五阶段，第三步和第四步凝聚成的两个小类凝聚成一个大类。利用树形图表示(p175) 1 2 3 4 5 6 个案类利用冰柱图表示(p175) 类数个案 1 2 3 4 5 6 1 2 3 4 5 个案1和2归一类个案4,5, 6归一类树状图和冰柱图表示聚类的过程十分的直观。二、Q聚类分析的SPSS过程第一步：数据文件的准备。Q聚类分析是根据一系列观测变量的测量值对个案进行分类，分类的依据是个案之间的“距离”。聚类之前的数据文件包括：n个个案的k个观测值。第二步：点击“Analyze”菜单选中“Classify”的“Hierarchical Cluster

您可能关注的文档

文档评论（0）

小教资源库 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

心理统计SPSS-第八章聚类分析原理及操作.pptVIP