- 209
- 0
- 约1.09万字
- 约 64页
- 2017-10-03 发布于湖北
- 举报
聚类分析及MATLAB实现研讨
聚类分析有两种:一种是对样品的分类,称为Q型,另一种是对变量(指标)的分类,称为R型。 ① 夹角余弦 两变量的夹角余弦定义为: ② 相关系数 两变量的相关系数定义为: 系统聚类法的基本思想 系统聚类分析的方法 最短距离 3.2.3 系统聚类法的步骤谱系聚类的步骤如下: 1. 选择样本间距离的定义及类间距离的定义; 2. 计算n个样本两两之间的距离,得到距离矩阵 3. 构造个类,每类只含有一个样本; 4. 合并符合类间距离定义要求的两类为一个新类; 5. 计算新类与当前各类的距离。若类的个数为1,则转到步骤6,否则回到步骤4; 6.画出聚类图; 7.决定类的个数和类。 系统聚类法的基本步骤 系统聚类分析用到的函数: Matlab实现聚类: Matlab提供了两种方法进行聚类分析。 一种是利用 clusterdata函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法; 另一种是分步聚类:(1)找到数据集合中变量两两之间的相似性和非相似性,用pdist函数计算变量之间的距离;(2)用 linkage函数定义变量之间的连接;(3)用 cophenetic函数评价聚类信息;(4)用cluster函数创建聚类。 说明:用 ‘metric’指定的方法计算 X 数据矩阵中对象之间的距离。’ X:一个n×m的矩阵,它是由n个对象组成
原创力文档

文档评论(0)