第三章聚类分析课件.pptVIP

  • 10
  • 0
  • 约6.16千字
  • 约 85页
  • 2017-08-25 发布于广东
  • 举报
第三章 聚类分析cluster analysis 概述 距离与相似系数 系统聚类法 (hierarchical clustering ) 快速聚类法 (k-means clustering) 变量聚类 一、概述 聚类的实质 根据样本(变量)间的亲疏关系将样本(变量)分为类,相近的归为一类,差别较大的归为另一类。所获得的分类应有一定的意义。 聚类分析的关键 亲疏关系的判别:相似性与距离(不相似性) 分类数的确定:分多少类合适 聚类分析的应用 不同地区城镇居民收入和消费状况的分类研究。 区域经济及社会发展水平的分析及全国区域经济综合评价 产品市场细分:按照消费者的需求特征分成不同的细分市场 在儿童生长发育研究中,把以形态学为主的指标归于一类,以机能为主的指标归于另一类 聚类分析的类型 根据分类的对象 Q型聚类(即样品聚类clustering for individuals) R型聚类(指标聚类clustering for variables) 根据分类的方法: 系统聚类(hierarchical clustering ) 快速聚类(k-means clustering) 聚类分析数据格式 二、距离与相似系数 样本间的亲疏关系通常用距离描述,变量间的亲疏关系通常用相似系数或相关系数描述 不同测量尺度的数据,其距离的计算方法不同 (一)、距离:样本间的亲疏关系 距离的定义: 假

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档