第12章+聚类分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第12章聚类分析

现实是复杂的,是绝对不可能由一 个有组织的科学模型完全描述出来 的。 ——Thomas Kuhn 第 12 章 聚类分析 12.1 聚类分析的基本原理 12.2 层次聚类 12.3 K-均值聚类 学习目标 聚类分析的基本思想和原理 层次聚类和K-均值聚类的基本过程 解释聚类的结果 层次聚类和K-均值聚类的差异及应用条件 聚类分析的注意事项 用SPSS进行聚类分析 例 对10位应聘者做智能检验。3项指标X,Y和Z分别表示数学推理能力,空间想象能力和语言理解能力。其得分如下,选择合适的统计方法对应聘者进行分类。 我们直观地来看,这个分类是否合理? 计算4号和6号得分的离差平方和: (21-20)2+(23-23)2+(22-22)2=1 计算1号和2号得分的离差平方和: (28-18)2+(29-23)2+(28-18)2=236 计算1号和3号得分的离差平方和为482,由此可见一般,分类可能是合理的,欧氏距离很大的应聘者没有被聚在一起。 由此,我们的问题是如何来选择样品间相似的测度指标,如何将有相似性的类连接起来? 聚类分析根据一批样品的许多观测指标,按照一定的数学公式具体地计算一些样品或一些参数(指标)的相似程度,把相似的样品或指标归为一类,把不相似的归为一类。 例如对上市公司的经营业绩进行分类;据经济信息和市场行情,客观地对不同商品、不同用户及时地进行分类。又例如当我们对企业的经济效益进行评价时,建立了一个由多个指标组成的指标体系,由于信息的重叠,一些指标之间存在很强的相关性,所以需要将相似的指标聚为一类,从而达到简化指标体系的目的。 聚类分析 (cluster analysis) 12.1.1 什么是聚类分析? 什么是聚类分析? (cluster analysis) 什么是聚类分析? (两种分类方式) 什么是聚类分析? (按什么分类) 12.1.2 相似性的度量 相似性的度量 相似性的度量 (样本点间距离的计算方法) 相似性的度量 (样本点间距离的计算方法) 相似性的度量 (变量相似系数的计算方法) 12.2.1 层次聚类的两种方式 层次聚类 (hierarchical cluster) 层次聚类 (合并法) 层次聚类 (分解法) 12.2.2 类间距离的计算方法 类间距离的计算方法 类间距离的计算方法 类间距离的计算方法 12.2.3 层次聚类的应用 层次聚类的应用 (实例分析) 用SPSS进行层次聚类 第1步 选择【Analyze】下拉菜单,并选择【Classify- Hierarchical Cluster】,进入主对话框 第2步 将用于聚类的所有变量选入【Variable(s)】;把区分样 本的标签 (本例为“地区”)选入【Label Cases by】;若 对样本进行聚类,在【Cluster】下选择【Cases】(本 例选择对样本聚类),若对变量进行聚类,在 【Cluster】下选择【Variables】 第3步 点入【Statistics】选中【Agglomeration schedule】, 点击【Continue】回到主对话框 第4步 点入【Plots】选中【Dendrogram】,点击 【Continue】回到主对话框 用SPSS进行层次聚类 第5步 点入【Method】,在【Cluster Method】中选择类间距离的 定义方法(本例选择Ward’s method);在【Measure】下选择 点间距离的定义方法(本例使用Squared Euclidean distance);在【Transform Values】的【Standardize】框中 选择否对原始数据进行标准化处理(本例选择了【Z scores】)。点击【Continue】回到主对话框 第6步 点入【Save】,在【Cluster Membership】下选择在原始数 据中保留分类结果,其中【Single solution】表示指定要分成 类时各样本所属的类,【Range

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档