- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
练习: 根据练8-2聚类分析-K均值聚类(游泳运动员)的数据,对各省学生进行分类 4 两阶段聚类 两阶段分类是根据不同变量类型进行的假设分类。 假设:连续变量为正态分布 分类变量为多项式分布 步骤: 1、对每个观测量考查一遍,确定类中心。 2、使用凝聚法对特征数的叶节点分组 主要思想:采用似然距离测度 例:汽车制造商需要评价当前市场,以确定他们的车辆在市场上的竞争地位,可根据各种车辆发动机构造、型号、价格等各种物理特性,使用两阶段聚类方法对数据进行分类。 自动聚类过程 BIC值最小,应该分为3类 各类频数分布 各类的类中心 不同类型的聚类结果频数 价格变量的并列均值图 发动机尺寸变量的并列均值图 横坐标——卡方分布 纵坐标——重要性临界值 分类变量的重要性 横坐标——t 分布 具体各车型分类结果 * 聚类分析的spss案例 1 层次聚类(hierarchical cluster) 例题:根据我国31个省市自治区2006年的6项主要经济指标数据,采用层次聚类法进行分类,并对结果进行分析 (表格数据未显示完整,有31个省份的6个经济指标) 2 层次聚类(hierarchical cluster) 第1步 选择【分析】下拉菜单,并选择【分类】 - 【系统分类】,进入主对话框 SPSS的操作步骤 2 层次聚类(hierarchical cluster) 在【分群】下选择【个案】(本例选择对样本聚类,即对“地区”进行分类),若对变量进行聚类,在【分群】下选择【变量】 SPSS的操作步骤 第2步 将用于聚类的所有变量选入【变量;把区分样本的标签 (本例为“地区”)选入【标注个案】; 第3步 点入【绘制】选中【树状图】,根据需要选择其它选项 2 层次聚类(hierarchical cluster) SPSS的操作步骤 第4步 点入【方法】,在【聚类方法】中选择类间距离的定义方法;在【度量标准】的【区间】下选择点间距离的定义方法;在【转换值】的【标准化】框中选择否对原始数据进行标准化处理。 2 层次聚类(hierarchical cluster) SPSS的操作步骤 类间距离:默认用离差平方和法 点间距离: 平方欧氏距离 制定分类:最多5类,最少2类,将结果表存在原始数据表中 第5步 点入【保存】,在【方案范围】指定要分成最少类、最多类时各样本所属的类,点击【继续】?【确定】 2 层次聚类(hierarchical cluster) SPSS的操作步骤 层 次 聚 类 过 程 的 步 骤 号 聚类步骤 每一步被合并的对象 聚类系数:距离 参与聚类的是原始的样本还是已经合并的小类 0表示本步聚类的原始样本,第一次出现;其他数字则表示第几步聚类生成的小类参与了本步聚类。 SPSS的输出结果 2 层次聚类(hierarchical cluster) 以上结果的说明 首先把31个地区各自作为一类(共有31类)。第1步是把距离最近的两个地区21(海南)和地区30(宁夏)合并成一类。第2步被合并的是21和地区29(青海),这里的“21”实际上是指在第1步中被合并的类别,只是用“21”表示21(海南)所在的类别 分成2类到5类时的结果 SPSS的输出结果 层 次 聚 类 的 树 状 图 分成两类 分成四类 最大距离作为相对距离25 ,其余的距离都换算成与 之相比的相对距离大小 ? ? ? ? ? ? SPSS的输出结果 冰柱图 SPSS的输出结果 类别 地区 地区个数 第一类 北京,天津,上海 3 第二类 河北,辽宁,安徽,福建,河南,湖北,湖南,四川 8 第三类 山西,内蒙古,吉林,黑龙江,江西,广西,海南,重庆,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆 16 第四类 江苏,浙江,山东,广东 4 根据层次聚类需要的结果进行分类汇总 练习: 根据练8-1聚类分析-系统聚类(各省学生体质)的数据,对各省学生进行分类 3 K-均值聚类(K-means cluster) 也被称为快速聚类(quick cluster) 按照一定方法选取一批聚类中心,让样品向最近的聚类中心聚集,形成初始分类,然后按照最近距离原则不断修改不合理分类,直至合理为止 需要确定要分的类别数目K 需要确定K个类别的初始聚类中心(可由SPSS指定聚类中心),依次计算每个样本到K个聚类中心的距离欧氏距离,经过反复迭代直到把每个样本分到指定的类别中。 3 K-均值聚类(K-means cluster) 例题:根据我国31个省市自治区2006年的6项主要经济指标数据,采用快速聚类法进行分类,并对结果进行分析 (表格数据未显示完整,有31个省份的6个经济指标) ? 数据检查 可以先观察6
您可能关注的文档
- 第四节、鱼(公开课课件)[1](精品·公开课件).ppt
- 第四节 科学探究电流的热效应(精品·公开课件).ppt
- 第四节_幼儿园课程的评价(精品·公开课件).ppt
- 第四节人工智能与仿真模拟费下载(精品·公开课件).ppt
- 第四节战略人力资源战略管理(精品·公开课件).ppt
- 第四棵--KEY(精品·公开课件).ppt
- 第四课 了解基本国策与发展战略复习资料 课件(精品·公开课件).ppt
- 第四课 网络安全和信息道德课件(精品·公开课件).ppt
- 第四课第四框《实施科教兴国的发展战略》课件(精品·公开课件).ppt
- 第四课生命共舟—合作与共赢(精品·公开课件).ppt
- 第四章 系统模型与模型化技术(聚类分析-理论)(精品·公开课件).ppt
- 第四章 系统软件及其常用操作系统(精品·公开课件).ppt
- 第四章 消费者行为分析(精品·公开课件).ppt
- 第四章 系统模型与模型化技术(聚类分析-自学)(精品·公开课件).ppt
- 第四章 薪酬水平决策(精品·公开课件).ppt
- 第四章 演示文稿制作软件(5课时)PowerPoint 2003(精品·公开课件).ppt
- 第四章 语文教学“点”的教学设计(精品·公开课件).ppt
- 第四章 性咨询与性治疗(精品·公开课件).ppt
- 第四章 战略管理(精品·公开课件).ppt
- 第四章 中国城市化历程及若干重要问题研究(精品·公开课件).ppt
最近下载
- 施工现场安全资料18卷内容及目录.doc VIP
- 《国家民用空间基础设施中长期发展规划(2015-2025年)》发布 .pdf VIP
- 鲁教版(五四学制)六年级上册地理知识点复习提纲填空练习版.docx VIP
- 2023-2024学年浙江省丽水市莲都区教科版五年级上册期末考试科学试卷(含答案).pdf VIP
- 图解医联体医学课件.ppt VIP
- 有机化学醇、酚、醚.pptx VIP
- 重大社2023电工技术基础与技能教学课件3-1-2 照明电路主要器件质量判定.pptx VIP
- GA_T 147-2019法医学 尸体检验技术总则.pdf
- 医院全员安全生产责任制度.docx VIP
- 家务服务员三级(三级)理论试题.doc VIP
文档评论(0)