spss使用教程聚类分析与判别分析.pptx

下载文档 降价啦

49
0
约8.14千字
约 133页
2021-11-03 发布于湖南
举报
保障服务

spss使用教程聚类分析与判别分析.pptx

;; 本章介绍统计学中经常使用的分类统计分析方法——聚类分析与判别分析。主要(zhǔyào)内容有层次聚类分析、快速聚类分析和判别分析。其中层次聚类分析根据聚类的对象不同分成Q型聚类和R型聚类。;8.1 聚类分析与判别分析的基本概念; 聚类分析是一种探索性的分析，在分类的过程中，人们不必事先给出一个分类的标准，聚类分析能够从样本数据出发，自动进行分类。聚类分析所使用方法的不同，常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析，所得到的聚类数未必一致。因此(yīncǐ)我们说聚类分析是一种探索性的分析方法。; 对个案的聚类分析类似于判别分析，都是将一些观察个案进行分类。聚类分析时，个案所属的群组特点还未知。也就是说，在聚类分析之前，研究者还不知道独立观察组可以分成多少(duōshǎo)个类，类的特点也无所得知。; 变量的聚类分析类似于因素分析。两者都可用于辨别变量的相关组别。不同在于，因素分析在合并变量的时候，是同时考虑(kǎolǜ)所有变量之间的关系；而变量的聚类分析，则采用层次式的判别方式，根据个别变量之间的亲疏程度逐次进行聚类。; 聚类分析的方法，主要有两种，一种是“快速聚类分析方法”（K－Means Cluster Analy- sis），另一种是“层次聚类分析方法”（Hierarchical Cluster Analysis）。如果观察值的个数多或文件非常庞大（通常观察值在200个以上），则宜采用快速聚类分析方法。因为观察值数目巨大，层次聚类分析的两种判别(pànbié)图形会过于分散，不易解释。; 判别分析是一种有效的对个案进行分类分析的方法。和聚类分析不同的是，判别分析时，组别的特征已知。如银行为了对贷款进行管理，需要预测哪些类型的客户可能不会(bù huì)按时归还贷款。已知过去几年中，900个客户的贷款归还信誉度，据此可以将客户分成两组：可靠客户和不可靠客户。 ; 再通过收集客户的一些资料，如年龄、工资收入、教育程度、存款等，将这些资料作为自变量。通过判别分析，建立判别函数。那么，如果有150个新的客户提交贷款请求，就可以利用创建好的判别函数，对新的客户进行分析，从而判??新的客户是属于可靠(kěkào)客户类，还是不可靠(kěkào)客户类。;8.2 层次(céngcì)聚类分析中的Q型聚类; 层次聚类分析(fēnxī)有两种形式，一种是对样本（个案）进行分类，称为Q型聚类，它使具有共同特点的样本聚齐在一起，以便对不同类的样本进行分析(fēnxī)；另一种是对研究对象的观察变量进行分类，称为R型聚类。它使具有共同特征的变量聚在一起，以便从不同类中分别选出具有代表性的变量作分析(fēnxī)，从而减少分析(fēnxī)变量的个数。 ; 本节讲述(jiǎngshù)Q型聚类的原理和SPSS的实现过程，下一节将讲述(jiǎngshù)R型聚类的实现过程。; 定义：层次(céngcì)聚类分析中的Q型聚类，它使具有共同特点的样本聚齐在一起，以便对不同类的样本进行分析。; 层次聚类分析中，测量样本之间的亲疏程度是关键。聚类的时候会涉及到两种类型亲疏程度的计算(jì suàn)：一种是样本数据之间的亲疏程度，一种是样本数据与小类、小类与小类之间的亲疏程度。下面讲述这两种类型亲疏程度的计算(jì suàn)方法和公式。; 计算公式如下。样本(yàngběn)数据之间的亲疏程度主要通过样本(yàngběn)之间的距离、样本(yàngběn)间的相关系数来度量。SPSS根据变量数据类型的不同，采用不同的测定亲疏程度的方法。; 样本(yàngběn)若有k个变量，则可以将样本(yàngběn)看成是一个k维的空间的一个点，样本(yàngběn)和样本(yàngběn)之间的距离就是k维空间点和点之间的距离，这反映了样本(yàngběn)之间的亲疏程度。聚类时，距离相近的样本(yàngběn)属于一个类，距离远的样本(yàngběn)属于不同类。; （1）欧氏距离（Euclidean Distance）两个(liǎnɡ ɡè)样本之间的欧氏距离是样本各个变量值之差的平方和的平方根，计算公式为; （2）欧氏距离平方（Squared Euclidean Distance）两个(liǎnɡ ɡè)样本之间的欧氏距离平方是各样本每个变量值之差的平方和，计算公式为; （3）Chebychev距离两个(liǎnɡ ɡè)样本之间的Chebychev距离是各样本所有变量值之差绝对值中的最大值，计算公式为; （4）Block距离两个(liǎnɡ ɡè)样本之间的Block距离是各样本

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

spss使用教程聚类分析与判别分析.pptx