统计分析聚类分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基本操作步骤2.选择距离计算方法第28页,共43页,星期日,2025年,2月5日聚类数目的确定聚类数目确定尚无统一标准,一般原则:各类所包含的元素都不应过多分类数目应符合分析的目的分层聚类中可以将类间距离作为确定类数目的辅助工具SPSS中,聚类过程中,类间距离呈增加趋势类间距离小,类的相似性大;距离大,相似性小绘制碎石图(X轴为类距离,Y轴为类数)实例:裁判打分.sav层次聚类第29页,共43页,星期日,2025年,2月5日输出第30页,共43页,星期日,2025年,2月5日第31页,共43页,星期日,2025年,2月5日第1页,共43页,星期日,2025年,2月5日6.2SPSS的聚类分析第2页,共43页,星期日,2025年,2月5日聚类分析概述概念:聚类分析是统计学中研究“物以类聚”的一种方法,属多元统计分析方法.例如:细分市场、消费行为划分聚类分析是建立一种分类,是将一批样本(或变量)按照在性质上的“亲疏”程度,在没有先验知识的情况下自动进行分类的方法.其中:类内个体具有较高的相似性,类间的差异性较大.第3页,共43页,星期日,2025年,2月5日聚类分析概述两类:(AB)(CDE)三类:(AB)(C)(DE)依据平均得分的差距,差距较小的为一类.分类过程中,没有事先指定分类的标准.完全根据样本数据客观产生分类结果.第4页,共43页,星期日,2025年,2月5日亲疏远程度的衡量指标相似性:数据间相似程度的度量距离:数据间差异程度的度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏远”,分别属于不同的类定距型个体间的距离:把每个个案数据看成是n维空间上的点,在点和点之间定义某种距离.一般适用于定距数据聚类分析概述第5页,共43页,星期日,2025年,2月5日(1)欧氏距离(EuclideanDistance)两个样本之间的欧氏距离是样本各个变量值之差的平方和的平方根,计算公式为第6页,共43页,星期日,2025年,2月5日(2)欧氏距离平方(SquaredEuclideanDistance)两个样本之间的欧氏距离平方是各样本每个变量值之差的平方和,计算公式为第7页,共43页,星期日,2025年,2月5日(3)Chebychev距离两个样本之间的Chebychev距离是各样本所有变量值之差绝对值中的最大值,计算公式为第8页,共43页,星期日,2025年,2月5日(4)Block距离两个样本之间的Block距离是各样本所有变量值之差绝对值的总和,计算公式为第9页,共43页,星期日,2025年,2月5日(5)Minkowski距离两个样本之间的Minkowski距离是各样本所有变量值之差绝对值的p次方的总和,再求p次方根。计算公式为第10页,共43页,星期日,2025年,2月5日(6)Customized距离(用户自定义距离)两个样本之间的Customized距离是各样本所有变量值之差绝对值的p次方的总和,再求q次方根。计算公式为第11页,共43页,星期日,2025年,2月5日(7)夹角余弦CosineCOSINE(x,y)(8)卡方距离第12页,共43页,星期日,2025年,2月5日二值变量型个体间的距离姓名授课方式上机时间选某门课程张三111李四110王五001聚类分析概述第13页,共43页,星期日,2025年,2月5日二值变量型个体间的距离简单匹配(simplematching)系数:适用二值变量。个体j个体i101ab0cda为个体i与个体j在所有变量上同时取1的个数;d为同时取0的个数特点:排除同时拥有或同时不拥有某特征的情况;取0和1地位等价,编码方案的变化不会引起系数的变化。聚类分析概述第14页,共43页,星期日,2025年,2月5日二值变量型型个体间的距离简单匹配(simplematching)系数:适用二值变

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档