- 24
- 0
- 约1.25万字
- 约 83页
- 2016-11-22 发布于湖北
- 举报
第八章 数据分类与降维技术配套教材:统计数据分析方法与技术经济管理出版社2014 第八章 数据分类与降维技术 8.1聚类分析 8.2判别分析 8.3主成分分析 8.4因子分析 8.1聚类分析 8.1.1聚类分析的含义及原理 8.1.2样品或变量相似程度的度量 8.1.3系统聚类法 8.1.4聚类分析案例及SPSS实现 8.1.1聚类分析的含义及原理 1、聚类分析的含义与基本原理 含义:聚类分析(Cluster Analysis)又称群分析,是根据“物以类聚”的道理,将大量的样品(或变量)依据数据间的相似性归为不同类的一种数据分类方法。 原理:根据已知数据,通过计算测定各样品(或变量)之间的相似程度,根据某种准则,将众多样品(或变量)归为不同类的一种多元统计分析方法,聚类的结果要使同一类样品(或变量)间的差别较小,而类与类之间的差别较大。 8.1.1聚类分析的含义及原理 2、聚类分析的特点 (1)聚类分析属于探索性分类方法,通过分析数据的内在特点和规律,根据个体或变量的相似性对其进行分类。 (2)聚类分析适用于没有先验知识的分类。 (3)聚类分析得到的“类”并不存在一个明确的概念,需要研究者结合研究目的和任务加以概括。 (4)聚类分析适合处理多个变量决定的分类。 8.1.1聚类分析的含义及原理 3、聚类分析的类型 (1)根据聚类方法不同分:系统聚类与快速聚类 系
原创力文档

文档评论(0)