研一spss复习资料07聚类分析.ppt

现代统计理论与方法 第7章 聚类分析 聚类分析的基本概念 7.1 层次聚类分析中的Q型聚类 7.2 层次聚类分析中的R型聚类 7.3 快速聚类分析 7.4 7.1 聚类分析的基本概念 聚类分析是统计学中研究这种“物以类聚”问题的一种有效方法,它属于统计分析的范畴。聚类分析的实质是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。这里所说的类就是一个具有相似性的个体的集合,不同类之间具有明显的区别。 聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。 变量的聚类分析类似于因素分析。两者都可用于辨别变量的相关组别。不同在于,因素分析在合并变量的时候,是同时考虑所有变量之间的关系;而变量的聚类分析,则采用层次式的判别方式,根据个别变量之间的亲疏程度逐次进行聚类。 聚类分析的方法主要有两种,一是“快速聚类分析方法”(K-Means Cluster Analysis),另一是“层次聚类分析方法”(Hierarchical Cluster Analysis)。如果观察值的个数多或文件非常庞大(观察值在200个以上),则宜采用快速聚类分析方法。 组内密度大 组间差异大

文档评论(0)

1亿VIP精品文档

相关文档