SPSS聚类分析详解课件.ppt

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS聚类分析详解课件

聚类分析;K-均值聚类分析 K-means Cluster;基本原理 具体做法 1、按照指定的分类数目n,按某种方法选择某些观测量,设为{Z1,Z2,…Zn},作为初始聚心。 2、计算每个观测量到各个聚心的欧氏距离。即 按就近原则将每个观测量选入一个类中,然后计算各个类的中心位置,即均值,作为新的聚心。 3、使用计算出来的新聚心重新进行分类,分类完毕后继续计算各类的中心位置,作为新的聚心,如此反复操作,直到两次迭代计算的聚心之间距离的最大改变量小于初始聚类心间最小距离的倍数时,或者到达迭代次数的上限时,停止迭代。;屯纫仪砷弘咸辫界旨人窝锨斡钠懂涪岭窃沏曲衔拂怖型魁勘套坏檀慰痈痊SPSS聚类分析详解课件SPSS聚类分析详解课件;数据标准化处理:;存储中间过程数据;数据标准化处理,并存储。;骑赵早骸峦杰亥律秒滑号赖滇痔胰傅满几渝杜佐迅鳞权嗡艰已舶冷赖想单SPSS聚类分析详解课件SPSS聚类分析详解课件;指定5类;收敛标准值;存储最终结果输出情况,在数据文件中(QCL-1、QCL-2);初始聚心选项,输出方差分析表;初始聚类中心表;具体城市看后表;聚类结果:QCL-1说明聚类结果,QCL-2说明聚类的长度情况;系统聚类法 Hierarchical Cluster;应用实例;按公式计算两两样品间的相似系数,得相似矩阵;作聚类分析图;一、问题提出 聚类分析——对一批样品或指标进行分类的一种统 计方法。;2)形成一个由小到大的分析系统。 3)把整个分类系统画成一张分类图;二、聚类统计量;对于任意两个样品Xi和Xj的相似程度可用这两个向量之间的夹角余弦 ;如果把上述n个样品的任何两个样品的相似系数;用相似系数作为聚类统计量时的分类方法;2、分类方法;要求对此7个样品进行聚类,采用的聚类统计量是相似系数(夹角余弦); 1 2 3 4 5 6 7; 1 2 3 4 5 6 7;(3)记下Q中剩余元素最大值q24=0.91,划去Q中的第4行第4列 (4)记下Q中剩余元素最大值q26=0.67,划去Q中的第6行第6列 (5)记下Q中剩余元素最大值q12=0.51,划去Q中的第2行第2列 (6)记下Q中剩余元素最大值q17=0.24 ;作聚类图:;2)利用相关作聚类分析; 1 2 3 4 5 6 7 8;按矩阵R中数值对8个指标(按四个原则)进行聚类: 1)记下矩阵中的最大值;作聚类图:;主要城市日照时数;注:连续变量;拳辖睫乐芝刹案咳渠旱香介献窃本柑炽贱鹏宴啪冤卡炙蚊绽孤孵稀蔫绸妮SPSS聚类分析详解课件SPSS聚类分析详解课件;SPSS提供不同类间距离的测量方法 1、组间连接法 2、组内连接法 3、最近距离法 4、最远距离法 5、重心法 6、中位数法 7、Ward最小偏差平方和法;观测量概述表;聚类步骤,与图结合看!;4、5;稳圃祟幸疤褪臀姨朱旨邻迹澈坐愈丸素爵苑卧轧案亢工捣粤率僧骋律扬搔SPSS聚类分析详解课件SPSS聚类分析详解课件;聚类方法有系统聚类和逐步聚类,输入数据集可以是普通数据集、相关矩阵(CORR过程产生)或协方差矩阵(FACTOR等过程产生)。SAS提供的聚类过程有: 1、CLUSTER对坐标数据或距离数据的观测值用11种方法进行系统聚类,当观测值数太多时,不宜直接采用。 2、FASTCLUS对于坐标数据,用K-均值法对观测值进行逐步聚类,当观测值很多时,则先用FACTCLUS过程对其进行初步聚类,然后再用CLUSTER过程进行系统聚类。 3、VARCLUS通过斜交多组分量分析对变量进行系统聚类或逐步聚类。 4、TREE为CLUSTER或VARCLUS过程产生的输出画树状图。;CLUSTER过程 开始每个观测值自成一类,然后求两两之间的距离,将距离最近的两个观测值合成一类。这个过程一直进行下去,每次减少一类,直到合成一类为止。 聚类方法有11种,可根据问题的性质选用,它们的区别在于怎样计算两类之间的距离。 METHOD=指定方法 AVERAGE(平均法)、CENTROID(重心法)、COMPLETE(最大距离法)、DENSITY(密度法)、MEDIAM(中位数法)等;美国十个城市的分类 根据两个城市见航空距离将美国十个大城市作分类;聚类分析SAS程序:;观测值之间距离的均方根;孽晚忠响曙酣魄猫矫节甩报黍潭年滩履棺脂盐臣浅砚詹崭父还舅肄订姓霍SPSS聚类分析详解课件SPSS聚类分析详解课件;

文档评论(0)

dmdt5055 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档