基于SPSS的统计专业学生能力倾向聚类分析.docVIP

基于SPSS的统计专业学生能力倾向聚类分析.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SPSS的统计专业学生能力倾向聚类分析.doc

基于SPSS的统计专业学生能力倾向聚类分析   摘 要:文中利用SPSS软件对统计专业学生的成绩进行聚类分析,将学生分为四类,分析了每类学生的能力倾向,并进行了相应的就业指导。   关键字:SPSS;聚类分析;能力倾向;就业指导   注:本文为江苏省2013年大学生实践创新项目论文。   1 聚类分析原理   聚类分析是统计学中研究“物以类聚”问题的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,产生多个分类结果。类内部个体特征具有相似性,不同类个体特征的差异性较大。   聚类分析中,个体之间的“亲疏程度”是极为重要的,它将直接影响最终的聚类结果。对“亲疏程度”的测度一般有两个角度:第一,个体间的相似程度;第二,个体间的差异程度。衡量个体间的相似程度通常可采用简单相关系数或等级相关系数等。个体间的差异程度通常通过某种距离来测度。   定义个体间距离的方法也有很多,比如:欧氏距离、平方欧氏距离、切比雪夫距离、Block距离、明考斯基距离等。   常见的聚类分析方法有层次聚类和K-Means聚类。   2 数据来源   本文选取了08级统计班31名学生的24门主干课程,分别为:思想道德修养与法律基础、大学生体育、统计学原理、微积分、政治经济学、心理健康教育、线性代数、大学英语、应用统计学、国民经济统计学、线性规划、普通话口语、统计预测与决策、统计信息管理、管理信息系统、调查数据分析、统计实务、概率论与数理统计、运筹学、抽样技术、企业经济统计学、财务管理、SPSS在统计中的应用、消费者行为学。   将这24门课程的成绩输入SPSS19.0软件对其进行聚类分析。   3 实证检验   本文采用层次聚类方法进行聚类分析,那么,在衡量数据间的亲疏程度时涉及两个方面的问题,一是度量个体间的亲疏程度,本文采用平方欧氏距离;二是度量个体与小类之间、小类和小类之间的亲疏程度,这方面的度量也是通过距离来测度的,并且,这里的距离是在个体间距离的基础上定义的,常见的距离有最近邻居距离、最远邻居距离、组间平均链锁、组内平均链锁、重心距离和离差平方和法。本文的类间距离采用平均组间链锁距离。   并且,因为数据不存在数量级上的差异,因此无须进行标准化处理。   3.1 聚类分析树形图   聚类分析的树形图如图1所示。   从树形图可以看出:全班31名同学可以分成四类,周利静、朱潇潇、夏玉涛这三位同学为一类,郭勇一人为一类,夏正娟、杨欢为一类,剩余25位同学为一类。   3.2 各类别能力倾向分析   图1 生成的聚类分析树形图   通过比较各类别的成绩,解释各类别的学生能力倾向特点。   各类别的成绩分布如表1所示。(考虑到页面的限制,表1的课程只列举了其中的一部分。)   从表1的成绩,可以得到如下的分析结果:   第一类:有周利静、朱潇潇、夏玉涛三位同学。这三名学生各科成绩都普遍不错,有多门功课成绩都是名列前茅,总平均成绩也是全班的前三名。她们是各科普遍优秀的典型代表,因此可以定义她们为“优秀型学生”。   第二类:有陈佩佩等25位同学,是最大的一个类别。从成绩看,他们的各科成绩比较平均。基本上没有特别好的也没有特别差的,都维持在中游的水平,因此可以定义他们为“良好型学生”。   第三类:只有郭勇一位同学。他的成绩没有高分但也没有不及格的,但是纵向比较可以看出,比如他的《大学英语》课程,考了68分,但是排在班级倒数第二,再比如说,《统计信息管理》课程,考了63分,全班倒数第一。因此,虽然他的总平均分也能达到75分,但他跟第二类的同学们显然还是有差距的。因此,可以定义他为“合格型学生”。   第四类:有夏正娟和杨欢两位同学。这两位同学都存在着课程不及格现象,夏正娟的《应用统计学》和《国民经济统计学》两门课程不及格,杨欢《应用统计学》和《统计实务》不及格,且不及格成绩很低。他们都属于统计学方面的应用实务方面掌握得很差。因此可以定义她们为“不及格学生”。   3.3 相应就业指导   对于“优秀型学生”,不论是理论、实践还是技能操作,她们都能够胜任。应该努力培养她们成为统计工作岗位的骨干力量。   对于“良好型学生”,他们具备良好的统计知识和技能,只是学得不太精,这部分同学应该根据自身爱好,发挥各自所长,培养成为统计工作岗位的技术能手。   对于“合格型学生”,他的统计专业素养不是很好,但他的统计软件动手操作能力不错,建议在统计工作岗位中成长为数据分析软件能手。但要想走得远,必须还要进一步地重温统计专业基础知识。   对于“不合格学生”,她们的统计应用型课程存在不及格,且其他课程成绩一般,因此建议她们可以改选其他方面工

文档评论(0)

guan_son + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档