- 22
- 0
- 约3.48千字
- 约 51页
- 2016-12-21 发布于重庆
- 举报
第八章 聚类分析 分类 物以类聚、人以群分; 但根据什么分类呢? 如要想把中国的县分类,就有多种方法 可以按照自然条件来分,比如考虑降水、土地、日照、湿度等, 也可考虑收入、教育水准、医疗条件、基础设施等指标; 既可以用某一项来分类,也可以同时考虑多项指标来分类。 聚类分析 对一个数据,既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。 当然,不一定事先假定有多少类,完全可以按照数据本身的规律来分类。 本章要介绍的分类的方法称为聚类分析(cluster analysis)。对变量的聚类称为R型聚类,而对观测值聚类称为Q型聚类。它们在数学上是无区别的。 1、聚类分析的基本思想 是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕. 相似样本或指标的集合称为类。 3、相似性度量 相似系数:性质越接近的变量或样品,它们的相似系数越接近于1或-1,而彼此无关的变量或样品它们的相似系数则越接近于0,相似的为一类,不相似的为不同类; 距离:变量或样本间的距离越近,说明其相似性越高,应归为一类;距离越远则说明相似性越弱,应归为不同的类。 距离和相似系数有着各种不同的定义,
您可能关注的文档
最近下载
- 康明斯PT泵燃油系统.ppt VIP
- 默纳克荣耀柜大功率别墅梯配一体化轿顶检修盒(MCTC-CTW-B3&A9适用)电气原理图(含手拉门)_中文版.pdf VIP
- 2026【期中】家长会:致敬每位不容易的家长 课件(共37张PPT).pptx VIP
- 基于stm32肺活量测量装置设计.docx
- 2026年职业技能中医康复理疗师-理论知识参考题库含答案解析(5卷题有答案).docx VIP
- 要想知道自己姓氏来源去看:四川渠县百家姓姓氏探源.pdf VIP
- 小儿肾积水诊疗指南(2025年版).docx VIP
- 基于低碳理念的城市滨水公园景观设计——以宁德时代工业文化园设计为例.pdf
- 产品供货紧急情况应对预案.docx VIP
- (2025春新版本)人教版七年级生物下册全册教案.docx
原创力文档

文档评论(0)