- 3
- 0
- 约2.92千字
- 约 27页
- 2019-05-06 发布于福建
- 举报
气候统计第三章2聚类分析
§3.3 聚类分析概要 聚类分析是研究多要素的客观分类方法,即运用数学方法对不同的样品进行数字分类,定量地确定样品之间的亲疏关系,并按照它们之间的相似程度,归组并类,以便客观分类的一种统计分析方法。它同判别分析同属分类问题,但前提不相同,所给的样本类型和类型数都是未知的。气象学中存在许多分类问题,如气候分类区划、天气过程分类、环流分类、预报因子的合并归类、相似年的确定等。 一、相似性指标统计量 1.样品与分类指标 对与研究对象有关的m个变量作n次观测,得样本矩阵, 称每行为一个分类指标,每一列为一个样品,对样品进行分类;每个样品包含m个指标,即样品的特征用m个指标来描写,可以是一个测站的m个指标的时间分布,也可以是同一指标的m个测站的时空分布。 2.距离和相似系数 进行分类,要将特征相似的样品聚为同一类,首先要定义样品之间亲疏程度的数量指标。 A、距离 样品看作m维空间的点,以某种形式定义点与点之间差异大小(不完全是地理或几何距离),数学上的距离可以有不同定义,但要满足4个条件 1)dij=0时,样品i和j 恒等(dii=0) 唯一性和单一性 2)dij≥0, 非负性 3)dij=dji
原创力文档

文档评论(0)