SPSS-聚类和判别分析-----精品课件下载.pptVIP

SPSS-聚类和判别分析-----精品课件下载.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章聚类和判别分析1. 主要内容10.0 聚类与判别分析概述10.1两步聚类10.2 快速聚类10.3 分层聚类10.4 判别分析2. 10.0 聚类与判别分析概述(1) 聚类分析 聚类分析的基本思想是找出一些能够度量样本或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样本(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样本又聚合为一类。(2) 判别分析 判别分析是判别样本所属类型的一种统计方法。(3) 二者区别 不同之处在于,判别分析是在已知研究对象分为若干类型(或组别)并已取得各种类型的一批已知样本的观测量数据的基础上,根据某些准则建立判别式,然后对未知类型的样本进行差别分析。 3. 主要内容10.0 聚类与判别分析概述10.1两步聚类10.2 快速聚类10.3 分层聚类10.4 判别分析4. 10.1两步聚类基本概念 两步聚类(TwoStep Cluster)是一个探索性的分析工具,为揭示自然的分类或分组而设计,是数据集内部的而不是外观上的分类。它是一种新型的分层聚类算法(Hierarchical Algorithms),目前主要应用到数据挖掘(Data Mining)和多元数据统计的交叉领域——模式分类中。该过程主要有以下几个特点:分类变量和连续变量均可以参与两步聚类分析;该过程可以自动确定分类数;可以高效率地分析大数据集;用户可以自己定制用于运算的内存容量。 5. 10.1两步聚类 统计原理 两步法的功能非常强大,而原理又较为复杂。他在聚类过程中除了使用传统的欧氏距离外,为了处理分类变量和连续变量,它用似然距离测度,它要求模型中的变量是独立的,分类变量是多项式分布,连续变量是正态分布的。分类变量和连续变量均可以参与两步聚类分析。分析步骤第1步 预聚类:对每个观测变量考察一遍,确定类中心。根据相近者为同一类的原则,计算距离并把与类中心距离最小的观测量分到相应的各类中去。这个过程称为构建一个分类的特征树(CF)。 第2步 正式聚类:使用凝聚算法对特征树的叶节点分组,凝聚算法可用来产生一个结果范围。 6. 10.1两步聚类 SPSS实现举例 【例10-1】1985年中国学生体质调查,各省19-22岁年龄组城市男学生身体形态指标的平均值,身高,坐高,体重,胸围,肩宽及骨盆宽的数据如下表所示,试根据身体形态指标进行样本聚类分析。 省份身高坐高体重胸围肩宽骨盆宽省份身高坐高体重胸围肩宽骨盆宽北京173.2893.6260.186.7238.9727.51江苏171.3692.5358.3987.0938.2327.04天津172.0992.8360.3887.3938.6227.82浙江171.2492.6157.6983.9839.0427.07河北171.4692.7359.7485.5938.8327.46安徽170.4992.0357.5687.1838.5427.57山西170.0892.2558.0485.9238.3327.29河南170.4392.3857.8784.8738.7827.37内蒙古170.6192.3659.6787.4638.3827.14青海170.2791.945684.5237.1626.81辽宁171.6992.8559.4487.4538.1927.1福建169.4391.6757.2283.8738.4126.6吉林171.4692.9358.787.0638.5827.36江西168.5791.455.9683.0238.7426.97黑龙江171.693.2859.7588.0338.6827.22湖北169.8891.8956.8786.3438.3727.19山东171.692.2660.587.6338.7926.63湖南167.9490.9155.9786.7738.1727.16陕西171.1692.6258.7287.1138.1927.18广东168.8291.356.0785.8737.6126.67甘肃170.0492.1756.9588.0838.2427.65广西168.0291.2655.2885.6339.6628.07宁夏170.6192.557.3485.6138.5227.36四川167.8790.9655.7984.9238.226.53新疆171.3992.4458.9285.3738.8326.47贵州168.1591.554.5684.8138.4427.38上海171.8392.7956.8585.3538.5827.03云南168.9991.5255.1186.2338.327.147. 10.1两步聚类 SPSS实现

文档评论(0)

叶子 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档