第四章 系统模型与模型化技术(聚类分析spss案例).pptVIP

  • 91
  • 0
  • 约3.3千字
  • 约 10页
  • 2017-01-03 发布于重庆
  • 举报

第四章 系统模型与模型化技术(聚类分析spss案例).ppt

练习: 根据练8-2聚类分析-K均值聚类(游泳运动员)的数据,对各省学生进行分类 4 两阶段聚类 两阶段分类是根据不同变量类型进行的假设分类。 假设:连续变量为正态分布 分类变量为多项式分布 步骤: 1、对每个观测量考查一遍,确定类中心。 2、使用凝聚法对特征数的叶节点分组 主要思想:采用似然距离测度 例:汽车制造商需要评价当前市场,以确定他们的车辆在市场上的竞争地位,可根据各种车辆发动机构造、型号、价格等各种物理特性,使用两阶段聚类方法对数据进行分类。 自动聚类过程 BIC值最小,应该分为3类 各类频数分布 各类的类中心 不同类型的聚类结果频数 价格变量的并列均值图 发动机尺寸变量的并列均值图 横坐标——卡方分布 纵坐标——重要性临界值 分类变量的重要性 横坐标——t 分布 具体各车型分类结果 * 聚类分析的spss案例 1 层次聚类(hierarchical cluster) 例题:根据我国31个省市自治区2006年的6项主要经济指标数据,采用层次聚类法进行分类,并对结果进行分析 (表格数据未显示完整,有31个省份的6个经济指标) 2 层次聚类(hierarchical cluster) 第1步 选择【分析】下拉菜单,并选择【分类】 - 【系统分类】,进入主对话框 SPSS的操作步骤 2 层次聚类(hierarchical cluster) 在【分群】下选择【个案】(本例选择对样本聚类,即对“地区”进行分类),若对变量进行聚类,在【分群】下选择【变量】 SPSS的操作步骤 第2步 将用于聚类的所有变量选入【变量;把区分样本的标签 (本例为“地区”)选入【标注个案】; 第3步 点入【绘制】选中【树状图】,根据需要选择其它选项 2 层次聚类(hierarchical cluster) SPSS的操作步骤 第4步 点入【方法】,在【聚类方法】中选择类间距离的定义方法;在【度量标准】的【区间】下选择点间距离的定义方法;在【转换值】的【标准化】框中选择否对原始数据进行标准化处理。 2 层次聚类(hierarchical cluster) SPSS的操作步骤 类间距离:默认用离差平方和法 点间距离: 平方欧氏距离 制定分类:最多5类,最少2类,将结果表存在原始数据表中 第5步 点入【保存】,在【方案范围】指定要分成最少类、最多类时各样本所属的类,点击【继续】?【确定】 2 层次聚类(hierarchical cluster) SPSS的操作步骤 层 次 聚 类 过 程 的 步 骤 号 聚类步骤 每一步被合并的对象 聚类系数:距离 参与聚类的是原始的样本还是已经合并的小类 0表示本步聚类的原始样本,第一次出现;其他数字则表示第几步聚类生成的小类参与了本步聚类。 SPSS的输出结果 2 层次聚类(hierarchical cluster) 以上结果的说明 首先把31个地区各自作为一类(共有31类)。第1步是把距离最近的两个地区21(海南)和地区30(宁夏)合并成一类。第2步被合并的是21和地区29(青海),这里的“21”实际上是指在第1步中被合并的类别,只是用“21”表示21(海南)所在的类别 分成2类到5类时的结果 SPSS的输出结果 层 次 聚 类 的 树 状 图 分成两类 分成四类 最大距离作为相对距离25 ,其余的距离都换算成与 之相比的相对距离大小 ? ? ? ? ? ? SPSS的输出结果 冰柱图 SPSS的输出结果 类别 地区 地区个数 第一类 北京,天津,上海 3 第二类 河北,辽宁,安徽,福建,河南,湖北,湖南,四川 8 第三类 山西,内蒙古,吉林,黑龙江,江西,广西,海南,重庆,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆 16 第四类 江苏,浙江,山东,广东 4 根据层次聚类需要的结果进行分类汇总 练习: 根据练8-1聚类分析-系统聚类(各省学生体质)的数据,对各省学生进行分类 3 K-均值聚类(K-means cluster) 也被称为快速聚类(quick cluster) 按照一定方法选取一批聚类中心,让样品向最近的聚类中心聚集,形成初始分类,然后按照最近距离原则不断修改不合理分类,直至合理为止 需要确定要分的类别数目K 需要确定K个类别的初始聚类中心(可由SPSS指定聚类中心),依次计算每个样本到K个聚类中心的距离欧氏距离,经过反复迭代直到把每个样本分到指定的类别中。 3 K-均值聚类(K-means cluster) 例题:根据我国31个省市自治区2006年的6项主要经济指标数据,采用快速聚类法进行分类,并对结果进行分析 (表格数据未显示完整,有31个省份的6个经济指标) ? 数据检查 可以先观察6

文档评论(0)

1亿VIP精品文档

相关文档