- 14
- 0
- 约1.91千字
- 约 17页
- 2017-04-23 发布于四川
- 举报
第十二章节聚类分析
; 聚类分析;把“对象”分成不同的类别
这些类不是事先给定的,而是直接根据数据的特征确定的
把相似的东西放在一起,从而使得类别内部的“差异”尽可能小,而类别之间的“差异”尽可能大
聚类分析就是按照对象之间的“相似”程度把对象进行分类;聚类分析的“对象”可以是所观察的多个样本,也可以是针对每个样本测得的多个变量
按照变量对所观察的样本进行分类称为Q型聚类
按照多项经济指标(变量)对不同的地区(样本)进行分类
按照样本对多个变量进行分类,则称为R型聚类
按照不同地区的样本数据对多个经济变量进行分类
两种聚类没有什么本质区别,实际中人们更感兴趣的通常是根据变量对样本进行分类(Q型聚类);按对象的“相似”程度分类
根据样本的观测数据测度变量之间的相似性程度可以使用夹角余弦、Pearson相关系数等工具,也称为相似系数
变量间的相似系数越大,说明它们越相近
根据变量来测度样本之间的相似程度则使用“距离”
把离得比较近的归为一类,而离得比较远的放在不同的类;相似性的度量(样本点间距离的计算方法);在对变量进行分类时,度量变量之间的相似性常用相似系数,测度方法有
;层次聚类又称系统聚类
事先不确定要分多少类,而是先把每一个对象作为一类,然后一层一层进行分类
根据运算的方向不同,层次聚类法又分为合并法和分解法,两种方法的运算原理一样,只是方向相反;将每一个样本作为一类,如果是k个样本就分k成类
原创力文档

文档评论(0)