数学实验05聚分析.ppt

数学实验05聚分析

第一节 聚类分析方法 第二节 聚类统计量 第三节 数据变换方法 第四节 系统聚类法 第五节 k-均值聚类法 第一节 聚类分析方法 聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。 基本思想是根据事物本身的特性研究个体分类的方法;聚类原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。 基本程序:是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。 具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法: 由小类合并到大类的方法 由大类分解为小类的方法 静态聚类法、动态聚类法 按样本聚类(Q)、按指标聚类(R) 饮料数据 16种饮料的热量、咖啡因、钠及价格四种变量 第二节 聚类统计量 一、概述 二、Q型聚类统计量 三、R型聚类统计量 概述 设有n个样本单位,每个样本测得p项指标(变量),原始资料阵为: Q型聚类一般以距离作为统计量,R型聚类一般以相似系数作为统计量。 Q型聚类统计量(距离) 把n个样本点看成p维空间的n个点 1、绝对距离(Block距离) 2、欧氏距离(Euclidean

文档评论(0)

1亿VIP精品文档

相关文档