第六讲 聚类分析.ppt

第六讲 聚类分析

第六讲 聚类分析 第一节 概述(什么是聚类) 第二节 相似性度量 第三节 系统聚类法 第四节 K均值聚类 俗话说“物以类聚,人以群分”。就是聚类分析的道理。 市场营销中市场细分和客户细分问题 学校里有些同学经常会在一起,关系密切;有些同学很少往来,关系疏远。 例 对10位应聘者做智能检验。3项指标X,Y和Z分别表示数学推理能力,空间想象能力和语言理解能力。其得分如下,选择合适的统计方法对应聘者进行归类。 聚类分析数据格式 例题分析 我们直观地来看,这个归类是否合理? 计算4号和6号得分的离差平方和: (21-20)2+(23-23)2+(22-22)2=1 计算1号和2号得分的离差平方和: (28-18)2+(29-23)2+(28-18)2=236 计算1号和3号得分的离差平方和为482,由此可见一般,归类可能是合理的,欧氏距离很大的应聘者没有被聚在一起。 由此,我们的问题是如何来选择样品间相似的测度指标,如何将有相似性的类连接起来? 聚类分析基本思想及原则 基本思想:根据事物本身的特性研究个体分类的方法;即在没有先验知识的情况下进行的。多元统计分析方法就是对样品或指标进行量化分类的问题,它们讨论的对象是大量的样品,要求能合理地按各自的特性来进行合理的分类,没有任何模式可供参考或依循。 聚类原则:同一类中的个

文档评论(0)

1亿VIP精品文档

相关文档