心理统计SPSS-第八章 聚类分析原理及操作.pptVIP

心理统计SPSS-第八章 聚类分析原理及操作.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
心理统计SPSS-第八章 聚类分析原理及操作

第八章 聚类分析的原理及操作 “物以类聚, 人以群分” ,科学研究在揭示对象特点及其相互作用的过程中, 不惜花费时间和精力进行对象分类 ,以揭示其中相同和不相同的特征。在心理学研究中, 经常遇到的分类包括两种情况:一是对研究样本或个案的分类, 即根据每个个案的一系列观测指标,将那些在这些观测量方面表现相近的个案归为一类, 将那些在这些观测量方面的表现很不相同的个案归为不同类;二是对观测量的分类,即将一系列的观测量归类合并为性质明显不同的少数几个方面。 一、聚类分析的基本原理 进行聚类分析,要先建立由某些事物属性构成的指标体系,或者说是一个变量组合。入选的每个指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,它们互相配合可以共同刻画事物的特征。 所谓完备的指标体系,是说入选的指标是充分的,其他任何新增变量对辨别事物差异无显著性贡献。如果所选指标不完备,则导致分类偏差。比如要对家庭教养方式进行分类,就要有描述家庭教育方式的一系列变量,这些变量能够充分地反映不同家庭对子女的教养方式。 简单地说,聚类分析的结果取决于变量的选择和变量值获取的两个方面。变量选择越准确、测量越可靠,得到的分类结果越是能描述事物各类间的本质区别。 距离或相似性程度是聚类分析的基础。点距如何计算呢?拿连续测量的变量来说,可以用欧氏距离平方计算:即各变量差值的平方和。 1. 聚类分析的前期准备工作 聚类分析是以完备的数据文件为基础的,一般还要求各个观测变量的量纲一致,即各变量取值的数量级一致。 所以,聚类分析前要检查各变量的量纲是否一致,不一致则需进行转换,如将各变量均作标准化转换就可保证量纲一致。 2. 聚类分析的主要方法 聚 类 分 析 层次聚类分析 快算聚类分析: Q聚类分析: R聚类分析: 使用有共同特征的样本聚齐在一起,以便对不同类的样本进行分析。 对研究对象的观察变量进行分类,它使具有共同变化特征的变量(相关性高)聚集在一起。 用户指定类别数的大样本资料的逐步聚类分析,其实质是K-Mean聚类,它先对数据进行初始分类,然后逐步调整,得到最终分类。 3. 聚类分析图形表示(p174) 例如,根据某一观测指标体系对6个个案进行聚类分析,已经知道指标体系中的变量均为连续变化的数据,所以采用欧氏距离测量个体与个体之间,小类与小类之间的距离,最先计算出来的个案间距离矩阵如表1。 表1 G(2) G(3) G(4) G(5) G(6) G(1) 2 5 3 7 8 G(2) 4 5 6 9 G(3) 7 7 9 G(4) 3 4 G(5) 6 凝聚状态表 依据距离最近原则,表1中个案1与个案2首先聚合在一起形成小类G(1,2),再以该小类,其他四个个体见距离计算距离矩阵,小类间或小类与个体间距离采用平均连锁法计算距离。如表2所示 表2 G(3) G(4) G(5) G(6) G(1,2) 5 5 7 8 G(3) 7 7 9 G(4) 4 G(5) 6 根据表2所示,个案4与个案5聚合在一起形成小类G(4,5)。再以两个小类、两个个案计算距离矩阵,如表3 表3 G(3) G(4,5) G(6) G(1,2) 5 6 7 G(3) 8 9 G(4,5) 5 表4 G(4,5,6) G(1,2,3) 7 根据表3所示,个案3与小类G(1,2)聚合在一起形成小类G(1,2,3),个案6与小类G(4,5)聚合在一起形成小类G(4,5,6),再计算小类间的距离,如表所示。 凝聚状态表表格形式(p175) 聚合阶段 相互聚合的小类 形成小类后再参与聚合的下一阶段 类1 类2 1 1 2 3 2 4 5 4 3 2 3 5 4 4 6 5 5 1 3 0 上述过程可以用一个表格加以呈现:第一阶段,个案1和个案2凝聚成一个小类;第二阶段,个案4和5凝聚成一个小类;第三阶段,个案3和第一阶段形成的小类凝聚成一个小类;第四阶段,个案6与第二阶段形成的小类凝聚;第五阶段,第三步和第四步凝聚成的两个小类凝聚成一个大类。 利用树形图表示(p175) 1 2 3 4 5 6 个案 类 利用冰柱图表示(p175) 类数 个案 1 2 3 4 5 6 1 2 3 4 5 个案1和2归一类 个案4,5, 6归一类 树状图和冰柱图表示聚类的过程十分的直观。 二、Q聚类分析的SPSS过程 第一步:数据文件的准备。Q聚类分析是根据一系列观测变 量的测量值对个案进行分类,分类的依据是个案之间的“距 离”。聚类之前的数据文件包括:n个个案的k个观测值。 第二步:点击“Analyze”菜单选中“Classify”的“Hierarchical Cluster

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档