网站大量收购独家精品文档,联系QQ:2885784924

第8讲.SPSS的多元统计分析:因子分析、聚类分析、判别分析.ppt

第8讲.SPSS的多元统计分析:因子分析、聚类分析、判别分析.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8讲.SPSS的多元统计分析:因子分析、聚类分析、判别分析

整体分析与设计的内容 聚类分析 二、快速聚类法 3.操作说明 3)“选项”按钮: 整体分析与设计的内容 聚类分析 二、快速聚类法 4.输出分析 1)初始中心表 2)迭代历史表 初始中心间的最小距离为13.128 整体分析与设计的内容 聚类分析 二、快速聚类法 4.输出分析 3)分析结果列表 列出了4类地区 整体分析与设计的内容 聚类分析 二、快速聚类法 4.输出分析 4)最终聚类分析中心表 5)最终聚类中心位置之间的距离 与初始中心比,变化很大 第一类和第二类之间的距离最大;第一类和第三类之间的距离最短。 整体分析与设计的内容 聚类分析 二、快速聚类法 4.输出分析 6)方差分析表 组间均方 组间自由度 组内均方 组内自由度 7)聚类数目汇总表 整体分析与设计的内容 聚类分析 三、系统聚类法 1. 算法原理 又称为层次聚类法或分层聚类法。 1)对研究对象本身进行分类,称为Q型聚类;对研究对象的观察指标 进行分类,称为R聚类。 2)根据聚类过程的不同,又分为分解法和凝聚法。 分解法:开始把所有个体(观测量或变量)都视为同属一大类,再根据距离和相似性逐层分解,直到参与聚类的每个个体自成一类为止。 凝聚法:开始把参与聚类的每个个体(观测量或变量)视为一类,根据两类之间的距离或相似性逐步合并,直到合并为一个大类为止。 系统聚类的距离公式有多种,常用的是“组间平均距离法”。 整体分析与设计的内容 聚类分析 三、系统聚类法 2. 案例背景 要求:不同地区信息基础设施发展状况的评价。 数据文件中给出了世界不同地区信息基础设施的发展状况。这里选取了发达地区、新兴工业化地区、拉美地区。亚洲发展中地区、转型地区等不同类型的20个地区的数据。 描述信息基础设施的变量主要有6个,分别为: Call:每千人拥有电话线数 Movecall:每千房居民移动电话数 Fee:高峰时期每三分钟国际电话的成本 Computer:每千人拥有的计算机数 Mips:每千人中计算机功率(每秒百万指令) Net:每千人互联网络户主数 根据这6个变量指标来分析地区之间的信息基础设施发展的差异,可采用系统聚类法. 整体分析与设计的内容 聚类分析 三、系统聚类法 3. 操作 数据文件:”不同地区信息基础设施发展状况的评价.sav” 菜单:“分析→分类→系统聚类” 即Q型聚类 即R型聚类 整体分析与设计的内容 聚类分析 三、系统聚类法 3. 操作 1)“统计量”按钮: 输出显示聚类过程中每一步合并的类或观测量,反映聚类过程中每一步样品或类的合并过程。 输出相似矩阵或不相似矩阵,及其更具体的类别,取决于“方法”按钮对应的对话框中的设置。 输入大于1的整数。例如,输入“2”,在结果窗口将显示输出聚为2类的分析结果。 输入大于1的整数。表述输出样本或变量的分类数从最小值到最大值的各种分类聚类表。最大类数值不能大于参与聚类的样本数或变量总数。 整体分析与设计的内容 聚类分析 三、系统聚类法 3. 操作 2)“绘制”按钮: 输入文本框的必须是正整数。分别是起、止步骤以及步长。例如,输入3、9、2,则生成的冰柱图则从第3步开始,显示第3、5、7、9步的聚类情况。 注意:“排序标准”标签文字翻译的不对,应该是“步长”才准确。 冰柱图的显示方向。 整体分析与设计的内容 聚类分析 三、系统聚类法 3. 操作 3)“方法”按钮: 该方法合并两类的依据是使这两个类别里所有两两配对观测量的平均距离最小。 该方法合并两类的依据是使两个类别合并后的新类中,观测量的平均距离最小。 离差平方和。聚类使得类内各样本的离差平方和最小;类间的离差平方和尽可能大。 适合于等间隔测度的连续性变量。下拉列表中可选择距离测度方法。 适合于字数变量(离散变量),下拉列表中可选择不相似性测度的方法。 选择标准化方法。 把相似性值变为不相似性或相反 整体分析与设计的内容 聚类分析 三、系统聚类法 3. 操作 4)“保存”按钮: 保存指定聚类个数时的分类结果。文本框的值必须是大于1的正数,且小于等于参与聚类的观测量个数和变量个数。 文本框中输入最小聚类数目和最大聚类数目,表示分别生成样本或变量的分类数从最小值到最大值的各种分类聚类变量。例如,输入“4”和“6”,表示在聚类结束后,在原数据集中将会增加3个变量,分别表明分为4类、5类和6类时的聚类结果,即分别为4、5、6类时各分析对象分别属于哪一类。 整体分析与设计的内容 聚类分析 三、系统聚类法 4. 输出分析 1)聚类过程表 步骤序号 第二列和第三列,给出了某一步骤中哪些地区参与了合并。例如,第一步中,第十个样品和第十二个样品,首先被合并在一起。 每一步的聚类系数。可根据这个系数来判断数据应该被分为多少类,当两个相邻步骤

文档评论(0)

5500046 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档