- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章
1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。
2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有:
(1)完全窗口菜单运行方式
(2)程序运行管理方式
(3)混合运行管理方式
3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。
第二章
1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。
2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(Variable)。
3.SPSS变量名的命名规则:
1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”);
2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等;
3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符;
4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。
4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、电话等)。
5.列和宽度的区别:
变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度;
列:设定该变量数据视图中列的宽度。
6.变量的值标签:即对数值含义的解释。例如:
值 标签 1
2 男
女 7.默认的缺失值类型:数值型类型(.)、字符串类型(空格)。
8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。
9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。
10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则,合并文件程序将失败。
11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。
课后练习题:
6.下列可以作为SPSS变量名的是
A).PRENTS12 B).1Name C).NOT TRUE D).@result
7.SPSS中可以设置工作目录,具体设置可以按照以下菜单:
A).【选项】→【设置】
B).【编辑】→【选项】→【设置】
C).【编辑】→【选项】→【文件位置】
D).【文件】→【选项】→【设置】
8.当合并Student-Infor.sav(参见表2-1)和Student-Scores.sav(参见表2-2)两个数据文件为一个数据集Student-Records.sav时,是增加记录还是增加变量?(表略,参见P67)
A).增加记录 B).增加变量 C).都不是 D).都正确
9.对上题的文件合并中,那个变量是关键变量:(对应知识点11)
A)学生ID B).性别 C).年龄和班级 D).科目 E).成绩
10.在合并两个SPSS文件时,正确的说法是:
A).如果是添加变量,SPSS可以显示变量是来源于那个数据文件
B).如果是添加个案,SPSS可以显示变量是来源于那个数据文件
C).合并两个SPSS文件后,将无法辨别个案来自于哪一个文件
D).以上都不正确
第三章
1.可是离散化的作用以及两类方法
作用:可视离散化用于为定量变量创建分类变量,从而实现连续变量的离散化。在统计分析中,有时候需要了解总体的大致分布状况,而不需要了解属性的具体信息。
两类方法:直接输入分割点和根据条件自动生成分割点。
2.数据缺失的可能原因,缺失值的定义以及如何处理缺失值?
1)原因:在数据收集阶段,收集者没有收集到相应数据;
应答着拒绝回答该问题,比如该问题涉及个人隐私;
该问题对该应答者不适用,比如该问题是针对女性的,而应答者为男性。
2)定义:缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类,分组,删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。用于数值型的数据,不能用于定类、定序型数据;易受极端值的影响;
中位数:主要用于定序数据,不能用于定类数据;不受极端值影响;
众数:主要用于定类数据;不受极端值影响;可能没有众数或多个众数。
对于数据变量和定序变量,可以用均值、中位数、众数;对于定类数据,只有众数。
4.对极差、方差、标准差作解释。
极差反映了变量的变异范围或离散幅度,在相同样本容量的两组数据中,全距大的一组数据比全距小的一组数据要分散。
方差和标准差越大,变量值之间的
文档评论(0)