lecture6 聚类分析081207.ppt

lecture6 聚类分析081207

第六章 聚类分析 北京交通大学 李卫东 前言 分类与日常生活相关,是科学研究的基础 例子: 对事物的命名分类 生物进化论(达尔文) 分类系统通常包括七个主要级别:种、属、科、目、纲、门、界。种(物种)是基本单元,近缘的种归合为属,近缘的属归合为科,科隶于目,目隶于纲,纲隶于门,门隶于界。 化学元素周期表(门捷列夫) 国家的分类 企业经济效益分析 文学研究 定性分类向定量分类过渡 第一节 聚类分析的基本思想 聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循,即是在没有先验知识的情况下进行的。 基本思想是根据事物本身的特性研究个体分类的方法;聚类原则是同一类中的个体有较大的相似性,不同类中的个体差异很大。 基本程序:是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。 具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法: 由小类合并到大类的方法 由大类分解为小类的方法 静态聚类法、动态聚类法 按样本聚类(Q)、按指标聚类(R) 例 对10位应聘者做智能检验。3项指标X,Y和Z分别表示数学推理能力,空间想象能力和语言理解能力。其得分如下,选择合适的统计

文档评论(0)

1亿VIP精品文档

相关文档