spss复习资料整理1.doc

下载文档 降价啦

283
0
约 21页
2017-09-26 发布于广西
举报
版权申诉
保障服务

spss复习资料整理1.doc

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第一章 1.SPSS是软件英文名称的首字母缩写，其最初为Statistical Package for the Social Sciences的缩写，即“社会科学统计软件包”。 2.SPSS系统运行管理方式（SPSS的几种基本运行方式）有：（1）完全窗口菜单运行方式（2）程序运行管理方式（3）混合运行管理方式 3.SPSS的界面提供的五个窗口：数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。第二章 1.SPSS的文件类型：语法文件（*.sps）、数据文件（*.sav）、结果输出文件（*.spv）。 2.SPSS数据编辑器的每一行数据称为一个个案（Case）,每一个数据代表个体的属性，即变量（Variable）。 3.SPSS变量名的命名规则： 1）必须以英文字母开头，其他部分可以含有字母、数字、下划线（即“-”）； 2）变量名尽量避免和SPSS已有的关键字重复，例如sum、compute、anova等； 3）SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符，或者32个中文字符； 4）SPSS变量名不区分大小写，即SPSS认为Name、name、nAme这三个变量名没有区别。 4.变量度量类型：定量（个数、高度、温度等）、定序（“十分重要”、“重要”、“一般”、“不重要”）、定类（名字、地址、电话等）。 5.列和宽度的区别：变量宽度：对字符型变量，该数值决定了你能输入的字符串的长度；列：设定该变量数据视图中列的宽度。 6.变量的值标签：即对数值含义的解释。例如：值标签 1 2 男女 7.默认的缺失值类型：数值型类型（.）、字符串类型（空格）。 8.数据文件的合并包括：纵向合并和横向合并（合并个案和合并变量），合并变量包括一对一合并和一对多合并。 9.SPSS用“（*）”表示变量来自于当前活动数据文件中的变量，而用“（+）”表示将要和当前数据文件进行合并的数据文件中的变量。 10.在合并数据文件之前，所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则，合并文件程序将失败。 11.（选择题）一对一合并变量时，两个文件都要提供个案；一对多合并时，活动的和非活动的文件都可以作为关键字。课后练习题： 6.下列可以作为SPSS变量名的是 A).PRENTS12 B).1Name C).NOT TRUE D).@result 7.SPSS中可以设置工作目录，具体设置可以按照以下菜单： A).【选项】→【设置】 B).【编辑】→【选项】→【设置】 C).【编辑】→【选项】→【文件位置】 D).【文件】→【选项】→【设置】 8.当合并Student-Infor.sav（参见表2-1）和Student-Scores.sav（参见表2-2）两个数据文件为一个数据集Student-Records.sav时，是增加记录还是增加变量？（表略，参见P67） A).增加记录 B).增加变量 C).都不是 D).都正确 9.对上题的文件合并中，那个变量是关键变量：（对应知识点11） A)学生ID B).性别 C).年龄和班级 D).科目 E).成绩 10.在合并两个SPSS文件时，正确的说法是： A).如果是添加变量，SPSS可以显示变量是来源于那个数据文件 B).如果是添加个案，SPSS可以显示变量是来源于那个数据文件 C).合并两个SPSS文件后，将无法辨别个案来自于哪一个文件 D).以上都不正确第三章 1.可是离散化的作用以及两类方法作用：可视离散化用于为定量变量创建分类变量，从而实现连续变量的离散化。在统计分析中，有时候需要了解总体的大致分布状况，而不需要了解属性的具体信息。两类方法：直接输入分割点和根据条件自动生成分割点。 2.数据缺失的可能原因，缺失值的定义以及如何处理缺失值？ 1）原因：在数据收集阶段，收集者没有收集到相应数据；应答着拒绝回答该问题，比如该问题涉及个人隐私；该问题对该应答者不适用，比如该问题是针对女性的，而应答者为男性。 2）定义：缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类，分组，删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。用于数值型的数据，不能用于定类、定序型数据；易受极端值的影响；中位数：主要用于定序数据，不能用于定类数据；不受极端值影响；众数：主要用于定类数据；不受极端值影响；可能没有众数或多个众数。对于数据变量和定序变量，可以用均值、中位数、众数；对于定类数据，只有众数。 4.对极差、方差、标准差作解释。极差反映了变量的变异范围或离散幅度，在相同样本容量的两组数据中，全距大的一组数据比全距小的一组数据要分散。方差和标准差越大，变量值之间的