SPSS回归分析PPT.ppt

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS回归分析PPT

9.3 K-均值聚类 根据组成每一类的观测量计算每个变量的均值,每一类中的n个均值在n维空间中又形成k个点,这就是第二次迭代的类中心。 按照这种方法迭代下去,直到达到指定 的迭代次数或达到中止迭代的判据要求时,迭代就停止了,聚类过程也就结束了。 (3)分析步骤 第1步 指定聚类数目k; 第2步 确定k个初始类中心; 第3步 根据距离最近原则进行分类; 第4步 重新确定k个类中心; 第5步 迭代计算。 9.3 K-均值聚类 9.3.2 SPSS实例分析 【例9-2】测量12名大学生对《高等数学》的心理状况和学习效果,主要包括四个因素:学习动机、学习态度、自我感觉、学习效果,具体数据如下表所示。试将该12名学生分成3类以分析不同心理状况下学生的学习效果。 编号 学习动机 学习态度 自我感觉 学习效果 1 40 80 54 44 2 37 73 56 46 3 43 70 75 58 4 50 77 85 77 5 47 87 89 63 6 67 70 84 69 7 77 37 57 100 8 80 37 73 82 9 83 40 76 96 10 87 43 75 91 11 60 57 70 85 12 70 50 69 90 9.3 K-均值聚类 第1步 分析:由于已知分成3类,故可采用快速分类法。 第2步 数据组织:按如上表的表头所示建立变量,将“编号”变量的数据类型设为字符型(作为标识变量)。 第3步 快速聚类设置,按“分析→分类→K-均值聚类”顺序打开“K-均值聚类分析”对话框,将“学习动机”、“学习态度”、“自我感觉”、“学习效果”四个变量选入“变量”列表框。将“编号”变量移入“个案标记依据”框中;将“聚类数”设为3。 其余“迭代”、“保存” 和“选项”设置参见教材。 9.3 K-均值聚类 第4步 主要结果及分析: 初始聚类中心表 Cluster 1 2 3 学习动机 40 67 77 学习态度 80 70 37 自我感觉 54 84 57 学习效果 44 69 100 迭代历史表 由表可知,第一次迭代后,3个类的中心点分别变化了8.193,9.889和13.472。一共进行了10次迭代,达到聚类结果的要求(达到最大迭代次数),聚类分析结束。 由于没有指定初始聚类中心,列出了由系统指定的类中心。与原数据比较,发现它们分别是第1、第6和第7号个案。 迭代 聚类中心内的更改 1 2 3 1 8.193 9.889 13.472 2 3.909 7.631 4.701 3 1.303 1.526 .672 4 .434 .305 .096 5 .145 .061 .014 6 .048 .012 .002 7 .016 .002 .000 8 .005 .000 3.996E-5 9 .002 9.768E-5 5.709E-6 10 .001 1.954E-5 8.155E-7 a. 迭代已停止,因为完成了最大次数的迭代。迭代无法收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 10。初始中心间的最小距离为 48.518。 9.3 K-均值聚类 最终聚类中心表 如第1类的学习动机值为39,学习态度值为77,自我感觉值为55,学习效果值为45。 样本数情况 可看出第1,2,3类中分别含有2,4,6个样本 聚类 1 2 3 学习动机 39 52 76 学习态度 77 76 44 自我感觉 55 83 70 学习效果 45 67 91 聚类 1 2.000 2 4.000 3 6.000 有效 12.000 缺失 .000 9.3 K-均值聚类 分类保存情况 查看数据文件,可看到多出两个变量,分别表示每个个案的具体分类归属和与类中心的距离。 主要内容 9.1 聚类与判别分析概述 9.2 二阶聚类 9.3 K-均值聚类 9.4 系统聚类 9.5 判别分析 8.3 曲线估计 第4步 进行曲线估计:依次选择菜单“分析→回归→曲线估计”,将所有模型全部选上,看哪种模型拟合效果更好(主要看决定系数R2),其所有模型的拟合优度R2如下表所示。 模型名称 R Square(R2) 直线(Linear) 0.941 二次曲线(Quadratic) 0.973 复合曲线(Compound) 0.789 生长曲线(Growth) 0.789 对数曲线(Logarithmic) 0.772 三次曲线(Cubic) 0.990 S曲线(S) 0.946 指数曲线(Exponential) 0.789 逆函数(Inverse) 0.481 幂函数(Power) 0.972 逻辑函数(Logistic) 0.789 从决定系数(R方即R2)来看,三次曲线效果最好(因为其R2值最大),并且方差分析的显著性水平(Sig.)为0。故重新进

文档评论(0)

djdjix + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档