- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《教育统计基础与spss》实训讲评6
《教育统计基础与spss》实训讲评6
实训6? SPSS过程
【内容】 SPSS过程
【例6-1】某教育研究者根据相关数据欲对北京地区18区县中职教育发展进行聚类研究。调研得到的资料主要包括:每万人的中职在校生数、每万人的中职招生数、每万人的中职毕业生数、每万人的中职专任教师数、专任教师中本科以上学历者占的比例、专任教师中高级职称者占的比例、学校平均在校生人数、中职发展预算经费占生产总值的比例、生均教育经费等,如表6-1所示。
表6-1 某一时段北京18区县中职教育发展状况调查数据
2.快速聚类分析的SPSS过程
【例6-2】假如要对一些高校图书馆的藏书情况进行分类研究,统计了20所学校的图书馆的藏书,包括外文图书册数(万册)、中文图书册数(万)、过刊卷数(万)、现刊卷数(万)、古籍册数(万)、工具书卷数(万)、艺术类书籍册数(万),数据如表6-4所示。请根据这些藏书情况,将图书馆分为三类。
表6-4 20所高校图书馆的藏书情况统计
【要求】
SPSS过程。
【】
SPSS软件系统能够很快捷地完成较大数据样本的聚类分析过程。
一、层次聚类分析的SPSS过程
层次聚类分析包括了Q型的聚类分析和R型的聚类分析,我们结合具体实例来说明这两种聚类分析的SPSS过程。
【例6-1】某教育研究者根据相关数据欲对北京地区18区县中职教育发展进行聚类研究。调研得到的资料主要包括:每万人的中职在校生数、每万人的中职招生数、每万人的中职毕业生数、每万人的中职专任教师数、专任教师中本科以上学历者占的比例、专任教师中高级职称者占的比例、学校平均在校生人数、中职发展预算经费占生产总值的比例、生均教育经费等,如表6-1所示。
表6-1 某一时段北京18区县中职教育发展状况调查数据
【解】本例中,18个区县就作为18个样本看待,对其中职教育发展状况的调查指标体系包含了9个变量,分别为 1 x , 2 x ,?, 9 x 。采用Q型聚类分析,其SPSS过程主要包括以下步骤:
步骤1:数据文件的建立
建立的SPSS数据文件由18行、10列组成,其中18行对应于18个个案,有9列对应于表中的9项调查数据,另外还有一列是作为个案标识变量。如图6-6所示。
图6-1 层次聚类分析的数据文件与菜单示意图
步骤2:打开主对话框并完成相应的设置
单击“Analyze”菜单选择“Classify”中的“Hierarchical Cluster?”命令,如图6-1所示,打开层次聚类分析的主对话框,如图6-2所示。
图6-2 层次聚类分析的主对话框
在如图6-2所示的对话框中,从左侧的变量列表中选择9个对应于指标体系的9个变量名,将它们置入右侧“variable(s)”下面的方框中;选择“地区”变量,将其添加到“label Cases by”下面的小方框中,选择标记变量将增强距离分析结果的可读性;因为要做Q型聚类分析,所以在对话框上“cluster”之下勾选“Cases”(在对变量进行R型聚类分析时,则要勾选“Variables”);为了输出需要的统计量和图形,“Display”之下的“Statistics”与“Plots”都要处于被勾选的状态。如图6-2所示。
步骤3:计算方法的设置
单击主对话框上的“Method”按钮,可以打开距离计算方法设置的对话框,即“Hierarchical Cluster Analysis:”对话框,如图6-3所示。
图6-3 设置距离计算方法的对话框
本例中,虽然有些变量是计数变量,但考虑到其数值分布范围较大,也近似地以等距变量看待,个案间距离的计算方法就选择欧氏距离平方(Squared Euclidean distance)。在该对话框的“Cluster Method”下拉菜单中指定的是小类之间的距离计算方法,本例中选择平均连锁法(Between-groups Linkage)。
在个案间距离的计算上,如果指标体系中是顺序变量、等级变量或称名变量,则需要将其作为计数变量来对待,勾选“Counts”后在其对应的下拉框中选择算法,如常选计算;如果指标体系中是二项记分变量,则需要勾选“Binary”后在其对应的下拉框中选择算法,如常选二元欧氏距离平方等。
另外,需要特别注意的是,本例中的各个变量的量纲不一致,需要进行量纲统一,然后才能进行距离的计算。本例中,我们在对话框上“Transform Values”下面做标准化转换的下拉框中选择标准分的转换方法,即“Z scores”,而且因为Q型聚类分析是针对个案进行的,所以在标准化处理时要勾选“By cases”(在进行R型聚类分析时,则要勾选“By variables”)。
完成上述设置后,单击“Continue”返回主对话框。
步骤4:指定图形的输出
文档评论(0)