第八章聚类分析..pptVIP

下载本文档

22
0
约3.48千字
约 51页
2016-12-21 发布于重庆
举报

第八章聚类分析..ppt

第八章聚类分析分类物以类聚、人以群分；但根据什么分类呢？如要想把中国的县分类，就有多种方法可以按照自然条件来分，比如考虑降水、土地、日照、湿度等，也可考虑收入、教育水准、医疗条件、基础设施等指标；既可以用某一项来分类，也可以同时考虑多项指标来分类。聚类分析对一个数据，既可以对变量(指标)进行分类(相当于对数据中的列分类)，也可以对观测值(事件，样品)来分类(相当于对数据中的行分类)。当然，不一定事先假定有多少类，完全可以按照数据本身的规律来分类。本章要介绍的分类的方法称为聚类分析（cluster analysis）。对变量的聚类称为R型聚类，而对观测值聚类称为Q型聚类。它们在数学上是无区别的。 1、聚类分析的基本思想是根据一批样品的多个观测指标，具体地找出一些能够度量样品或指标之间相似程度的统计量，然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类，把不相似的归为其他类。直到把所有的样品（或指标）聚合完毕. 相似样本或指标的集合称为类。 3、相似性度量相似系数：性质越接近的变量或样品，它们的相似系数越接近于1或-1，而彼此无关的变量或样品它们的相似系数则越接近于0，相似的为一类，不相似的为不同类；距离：变量或样本间的距离越近，说明其相似性越高，应归为一类；距离越远则说明相似性越弱，应归为不同的类。距离和相似系数有着各种不同的定义，

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第八章聚类分析..pptVIP