聚类分析与判别分析概要.ppt

  1. 1、本文档共132页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(7)输出结果的最后一个表格列出了4个类中分别包括的样本数,如下表所示。 (8)在步骤5中曾指定了将样本所属类以及样本和类中心点的距离,作为样本的2个新变量保存到SPSS的数据编辑窗口中。SPSS运行后,数据编辑窗口如图8-21所示,其中我们可以看到新增加了两个变量(图中加深的两列),分别表示样本所属类以及样本和类中心点的距离。 8.5 判 别 分 析 前面3节讲述了不同种聚类分析的方法,不论是哪种方法,聚类分析都是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。 图8-10 “Hierarchical Cluster Analysis”对话框(二) 图8-11 “Hierarchical Cluster Analysis:Method”对话框(二) 图8-12 “Hierarchical Cluster Analysis:Plots”对话框(二) 图8-13 “Hierarchical Cluster Analysis:Statistics”对话框(二) (1)首先是层次R型聚类分析的结果,该结果是SPSS输出结果文件中的第一个表格。 8.3.3 结果和讨论 (2)输出的结果文件中第二个表格如下表所示。 (3)输出的结果文件中第三个表格如下表所示。 (4)输出的结果文件中第四个表格如下表所示。 (5)输出的结果文件中第五个表格如下表所示。 (6)输出的结果文件中第六部分如下: 8.4 快速聚类分析 SPSS层次聚类分析对计算机的要求比较高,在大样本的情况下,可以采用快速聚类分析的方法。采用快速聚类分析,得到的结果比较简单易懂,对计算机的性能要求也不高,因此应用也比较广。 定义:快速聚类分析是由用户指定类别数的大样本资料的逐步聚类分析。它先对数据进行初始分类,然后逐步调整,得到最终分类。快速聚类分析的实质是K-Mean聚类。 8.4.1 统计学上的定义和计算公式 和层次聚类分析一致,快速聚类分析也以距离为样本间亲疏程度的标志。但两者的不同在于:层次聚类可以对不同的聚类类数产生一系列的聚类解,而快速聚类只能产生固定类数的聚类解,类数需要用户事先指定。 另外,在快速聚类分析中,用户可以自己指定初始的类中心点。如果用户的经验比较丰富,则可以指定比较合理的初始类中心点,否则,需要增加迭代的次数,以保证最终聚类结果的准确性。 计算公式如下。 快速聚类分析计算过程如下。 ? 首先需要用户指定聚类成多少类(比如k类)。 ? 然后SPSS确定k个类的初始类中心点。SPSS会根据样本数据的实际情况,选择k个由代表性的样本数据作为初始类中心。初始类中心也可以由用户自行指定,需要指定K组样本数据作为初始类中心点。 ? 计算所有样本数据点到k个类中心点的欧氏距离,SPSS按照距k个类中心点距离最短原则,把所有样本分派到各中心点所在的类中,形成一个新的k类,完成一次迭代过程。其中欧氏距离(Euclidean Distance)的计算公式为 ? SPSS重新确定k个类的中心点。SPSS计算每个类中各个变量的变量值均值,并以均值点作为新的类中心点。 ? 重复上面的两步计算过程,直到达到指定的迭代次数或终止迭代的判断要求为止。 ? 研究问题 为研究不同公司的运营特点,调查了15个公司的组织文化、组织氛围、领导角色和员工发展4方面的内容。现要将这15个公司按照其各自的特点分成4种类型,数据如表8-3所示。 8.4.2 SPSS中实现过程 表8-3 不同公司的特点 公 司 组 织 文 化 组 织 氛 围 领 导 角 色 员 工 发 展 Microsof 80.00 85.00 75.00 90.00 IBM 85.00 85.00 90.00 90.00 Dell 85.00 85.00 85.00 60.00 Apple 90.00 90.00 75.00 90.00 联想 99.00 98.00 78.00 80.00 NPP 88.00 89.00 89.00 90.00 北京电子 79.00 80.00 95.00 97.00 清华紫光 89.00 78.00 81.00 82.00 北大方正 75.00 78.00 95.00 96.00 TCL 60.00 65.00 85.00 88.00 娃哈哈 79.00 87.00 50.00 51.00 Angel 75.00 76.00 88.00 89.00 Hussar 60.00 56.00 8

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档