- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
9.3 K-均值聚类 根据组成每一类的观测量计算每个变量的均值,每一类中的n个均值在n维空间中又形成k个点,这就是第二次迭代的类中心。 按照这种方法迭代下去,直到达到指定 的迭代次数或达到中止迭代的判据要求时,迭代就停止了,聚类过程也就结束了。 (3)分析步骤 第1步 指定聚类数目k; 第2步 确定k个初始类中心; 第3步 根据距离最近原则进行分类; 第4步 重新确定k个类中心; 第5步 迭代计算。 9.3 K-均值聚类 9.3.2 SPSS实例分析 【例9-2】测量12名大学生对《高等数学》的心理状况和学习效果,主要包括四个因素:学习动机、学习态度、自我感觉、学习效果,具体数据如下表所示。试将该12名学生分成3类以分析不同心理状况下学生的学习效果。 编号 学习动机 学习态度 自我感觉 学习效果 1 40 80 54 44 2 37 73 56 46 3 43 70 75 58 4 50 77 85 77 5 47 87 89 63 6 67 70 84 69 7 77 37 57 100 8 80 37 73 82 9 83 40 76 96 10 87 43 75 91 11 60 57 70 85 12 70 50 69 90 9.3 K-均值聚类 第1步 分析:由于已知分成3类,故可采用快速分类法。 第2步 数据组织:按如上表的表头所示建立变量,将“编号”变量的数据类型设为字符型(作为标识变量)。 第3步 快速聚类设置,按“分析→分类→K-均值聚类”顺序打开“K-均值聚类分析”对话框,将“学习动机”、“学习态度”、“自我感觉”、“学习效果”四个变量选入“变量”列表框。将“编号”变量移入“个案标记依据”框中;将“聚类数”设为3。 其余“迭代”、“保存” 和“选项”设置参见教材。 9.3 K-均值聚类 第4步 主要结果及分析: 初始聚类中心表 Cluster 1 2 3 学习动机 40 67 77 学习态度 80 70 37 自我感觉 54 84 57 学习效果 44 69 100 迭代历史表 由表可知,第一次迭代后,3个类的中心点分别变化了8.193,9.889和13.472。一共进行了10次迭代,达到聚类结果的要求(达到最大迭代次数),聚类分析结束。 由于没有指定初始聚类中心,列出了由系统指定的类中心。与原数据比较,发现它们分别是第1、第6和第7号个案。 迭代 聚类中心内的更改 1 2 3 1 8.193 9.889 13.472 2 3.909 7.631 4.701 3 1.303 1.526 .672 4 .434 .305 .096 5 .145 .061 .014 6 .048 .012 .002 7 .016 .002 .000 8 .005 .000 3.996E-5 9 .002 9.768E-5 5.709E-6 10 .001 1.954E-5 8.155E-7 a. 迭代已停止,因为完成了最大次数的迭代。迭代无法收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 10。初始中心间的最小距离为 48.518。 9.3 K-均值聚类 最终聚类中心表 如第1类的学习动机值为39,学习态度值为77,自我感觉值为55,学习效果值为45。 样本数情况 可看出第1,2,3类中分别含有2,4,6个样本 聚类 1 2 3 学习动机 39 52 76 学习态度 77 76 44 自我感觉 55 83 70 学习效果 45 67 91 聚类 1 2.000 2 4.000 3 6.000 有效 12.000 缺失 .000 9.3 K-均值聚类 分类保存情况 查看数据文件,可看到多出两个变量,分别表示每个个案的具体分类归属和与类中心的距离。 主要内容 9.1 聚类与判别分析概述 9.2 二阶聚类 9.3 K-均值聚类 9.4 系统聚类 9.5 判别分析 8.3 曲线估计 第4步 进行曲线估计:依次选择菜单“分析→回归→曲线估计”,将所有模型全部选上,看哪种模型拟合效果更好(主要看决定系数R2),其所有模型的拟合优度R2如下表所示。 模型名称 R Square(R2) 直线(Linear) 0.941 二次曲线(Quadratic) 0.973 复合曲线(Compound) 0.789 生长曲线(Growth) 0.789 对数曲线(Logarithmic) 0.772 三次曲线(Cubic) 0.990 S曲线(S) 0.946 指数曲线(Exponential) 0.789 逆函数(Inverse) 0.481 幂函数(Power) 0.972 逻辑函数(Logistic) 0.789 从决定系数(R方即R2)来看,三次曲线效果最好(因为其R2值最大),并且方差分析的显著性水平(Sig.)为0。故重新进
您可能关注的文档
- IntroducingQoS幻灯片.ppt
- IntroductiontoFinancialAccountingTheory幻灯片.pptx
- IntroductiontoSamplingDistributions幻灯片.ppt
- IPsecComponentsandIPsecVPNFeatures幻灯片.ppt
- iSCSI存储技术方案教学教程.ppt
- iud的避孕原理介绍教学.ppt
- KblackpearlextensionsTrainingCourse幻灯片.pptx
- KKR杠杆购并RJRNABISCO幻灯片.ppt
- lc术教学教程.ppt
- libman医学课sacks心内膜炎赵锋幻灯片.ppt
最近下载
- 防盗门施工组织设计方案.doc VIP
- 2025年版高等职业教育专科专业教学标准 460115 智能光电制造技术.docx
- [美国时代周刊]Time2012-06-25.pdf VIP
- 中医医疗医院设备配置标准.pdf VIP
- 陕2023TJ 077《住宅厨房、卫生间装配式L型构件排气道系统图集》.pdf VIP
- (完整word版)JGJ107-2016钢筋机械连接技术规程.doc VIP
- 三+《品质》(教学课件)-【中职专用】高二语文(高教版2023·职业模块).pptx VIP
- 新课标下体育中考项目现状的分析与思考.docx VIP
- 新员工入职适应期的评估体系与职业发展建议.docx VIP
- 第三周(9月15日)国旗下讲话稿:勿忘国耻振兴中华.pdf VIP
文档评论(0)