第五章 聚类与判别分析.ppt

第五章 聚类与判别分析

第五章 聚类与判别分析(一) 主要内容 聚类及判别分析 快速样本聚类 分层聚类 判别分析 5.1 聚类与判别概述 聚类和判别都是分类学的基本方法,而分类学是人类认识世界的基础科学。掌握聚类和判别的方法对进一步运用统计这一工具来认识世界有着极其重要的意义。 聚类有两种基本的方法:快速样本聚类和分层聚类。 判别的分类方法就是先根据事物特点的变量值和它们所属的类求出判别函数,再根据判别函数对未知所属类别的事物进行分类的一种分析方法。 5.1 聚类与判别概述 5.1.1 聚类分析 聚类分析(Cluster Analysis )是根据事物本身的特性研究个体分类的方法。聚类分析的原则是同一类中的个体有较大的相似性,不同类的个体差异很大。根据分类对象不同分为样品聚类和变量聚类。 样品聚类在统计学中又称为Q 型聚类。用SPSS 的术语来说就是对事件(cases )进行聚类,或是说对观测量进行聚类。是根据被观测的对象的各种特征,即反映被观测对象的特征的各变量值进行分类。 变量聚类在统计学中有称为R 型聚类。反映事物特点的变量有很多,我们往往根据所研究的问题选择部分变量对事物的某一方面进行研究。 5.1 聚类与判别概述 5.1.1 聚类分析 根据分类对象的不同,样品(观测量)聚类和变量聚类两种: 样品聚类:对观测量(Case)进行聚类(不同的目的选用不同的指标作为分类的依据,如选拔运动员与分课外

文档评论(0)

1亿VIP精品文档

相关文档