- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SPSSPPT11讲解
方差分析表 快速聚类过程中方差分析的原假设虽然也是“各类均值相等”,但由于通过分类将类间的差异最大化了,所以分析结果仅可用于描述目的,即用于判定变量是否具有分类作用,而不能将其作为对假设“各类均值相等”下检验结论的依据。 如果在方差分析的结果中,某变量F值的显著性概率P0.05,则表明该变量对分类不起作用,可考虑将其排除出聚类过程。 3个变量都有 P0.05,应拒绝原假设,认为 3个变量都能很好地反映类间差异。 新变量 QCL_1 表示各个案所分到的类号。 聚类结果中的类中心信息保存在指定的数据文件中。此文件可作为对另一个样本进行快速聚类的初始类中心。 新变量QCL_2 表示各个案距所属类中心的欧氏距离。 系统聚类的过程是按一定的层次进行的,分为凝聚方式聚类和分解方式聚类。系统聚类既可以进行个案聚类(Q型聚类),也可以进行变量聚类(R型聚类)。所分析的变量既可以是连续型变量,也可以是分类变量。系统聚类提供了丰富的亲疏程度度量方法和结果表示方法,便于比较和选择。 11.3 系统聚类 SPSS中的系统聚类采用的是凝聚方式。其聚类的思路是:首先,每个个体自成一类。然后,按照某种方法度量所有个体间的亲疏程度,并将其中关系最密切的个体聚成一小类。接下来,再次度量剩余个体与小类的亲疏程度,并将当前关系最密切的个体或小类再聚成一类。重复上述过程,不断将所有个体或小类聚集成越来越大的类,直至所有个体都聚到一起,形成一个大类为止。 通过系统聚类,可以形成一个由小到大的分类系统,并可据此画出一张谱系图,把所有个体间的亲疏关系都表示出来,进而根据具体情况确定分类数和每一个体的归属。 11.3.1 系统聚类的基本步骤 1.Q型:计算n个个案两两间的距离或相似系数。 R型:计算p个变量两两间的距离或相似系数。 2.Q型:构造n个类,每类中只含一个个案。 R型:构造p个类,每类中只含一个变量。 3.将距离最短(或相似系数最大)的两类合并成一个新类。 4.若类数已为1,则转到步骤5;否则,计算新类与其他各类的类间距离,再转到步骤3。 5.画出聚类谱系图。 6.结合专业知识分析,决定分类数和具体类。 系统聚类的具体步骤: 7.在进行R型聚类后,往往还需要从各类中各挑出一个有代表性的指标。一般方法为: ⑴当类中只包含一个变量时,该变量就是典型指标。 ⑵当类中包含两个变量时,可任选一个作为典型指标。 ⑶当类中包含三个以上变量时,先计算各变量的平均相关指数,将平均相关指数最大的变量作为该类的典型指标。平均相关指数的计算公式为: 上式中,r为类中变量两两的相似系数,n为类中所包含的变量个数。 例11.2:为研究城镇居民生活消费的情况,收集了5省1991年8个消费指标(元/人)的数据如下。试对省份进行分类。 x1:粮食支出 x2:副食支出 x3:烟酒茶支出 x4:其他副食支出 x5:衣着支出 x6:日用品支出 x7:燃料支出 x8:非商品支出 x1 x2 x3 x4 x5 x6 x7 x8 G1 辽宁 7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29 G2 浙江 7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.87 G3 河南 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76 G4 甘肃 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35 G5 青海 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81 本例属于个案聚类(Q型),拟采用欧氏距离作为个体间初始亲疏程度的度量,采用最短距离法作为聚类过程中类间亲疏程度的度量。 计算5个省份两两之间的欧氏距离,得初始距离阵A0。例如,G1与G2的欧氏距离为: G1 G2 G3 G4 G5 G1 0 G2 11.67 0 G3 13.80 24.63 0 G4 13.12 24.06 2.20 0 G5 12.80 23.54 3.51 2.21 0 A0= 因G3与G4之间的距离最短,将此两类合并成G6。G1、G2、G5与新类G6的距离采用最
您可能关注的文档
- 安全重大事故应急救援预案解读.doc
- 安全输血相关知识解读.ppt
- 安全阀在线调校培训(原创)解读.ppt
- SpringAOP讲解.doc
- 安全集中整治汇报材料解读.doc
- 安全驾驶从这里开始科目一教材解读.doc
- spring定时任务讲解.doc
- solidworks零件设计讲解.ppt
- Spark入门实战系列讲解.docx
- 安培力的应用(平衡问题)解读.ppt
- 高中历史教学中人工智能教育平台数据加密算法的优化策略教学研究课题报告.docx
- 小学化学:磁铁磁力衰减规律在化学实验中的应用教学研究课题报告.docx
- 十大古代书画艺术流派传承与发展研究教学研究课题报告.docx
- 基于数字化校外实践,探索提升小学生信息素养的途径研究教学研究课题报告.docx
- 课程游戏化背景下幼儿园班本课程的实施探究.docx
- 教师职称评审量化指标体系构建研究——数字化教学画像的应用探讨教学研究课题报告.docx
- 人工智能助力小学生数字素养评价与教学效果提升教学研究课题报告.docx
- 7 《人工智能在妇产科疾病诊断中的图像识别准确性研究》教学研究课题报告.docx
- 乡村旅游社区品牌塑造与居民身份认同建设.docx
- 小学数学与应用学科:社区应急避难场所规划中的数学建模与应用研究教学研究课题报告.docx
文档评论(0)