第二章数据文件的建立和管理解析.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 数据文件的建立和管理 本章主要内容 第一节 SPSS数据文件 第二节 SPSS数据的结构和定义方法 第三节 SPSS数据的录入和编辑 第四节 SPSS数据的保存 第五节 读取其他格式的数据文件 第六节 SPSS数据文件的合并 第一节 SPSS数据文件 1、 SPSS数据文件的特点: SPSS数据文件有别于其他文件,是一个有特殊格式的文件,它是一种有结构的数据文件,它由数据结构和内容两部分组成,其中,数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,内容才是那些待分析的具体数据。 基于上述特点,建立SPSS数据文件时应完成两项任务,即描述数据的结构和录入编辑数据。 数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。 SPSS数据文件的结构就是对每个变量及相关特征的描述。 (2)频数数据的组织方式 例: 频数数据的组织方式 第二节 SPSS数据的结构和定义方法 SPSS数据的结构是对SPSS每列变量及其相关属性的描述,主要包括变量名、数据类型、变量宽度、小数位数、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、度量尺度等信息。 变量名(Variable name) 变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下: 1. 应以英文字母或汉字开头,后面可跟除了!、?、* 之外的字母或数字,下划线、圆点不能作为变量名的最后一个字符。SPSS允许用汉字作为变量名。 2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00002等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。 4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。 数据类型(Type) 数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型:数值型、字符型和日期型。 数值型 (1)标准型(Numeric) (2)科学记数法型(Scientific Notation) (3)逗号型(Comma) (4)圆点型(Dot) (5)美元符号型(Dollar) (6)用户自定义型(Custom Currency) 字符型(String) 日期型(Date) 数据类型表 数值型 数值型是SPSS最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。其中的标准型(numeric)是SPSS默认的数据类型,默认的显示宽度为8位,包括正负符号位、小数点和小数位在内,小数位默认为2位。如果数据的实际宽度大于8位,spss将自动按照科学计数法显示,数据的显示并不影响数据的存储,也不影响数据的计算。 字符型 字符型也是SPSS较常用的数据类型,由一个字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。字符型数据的默认显示宽度为8个字符,不能够进行算术运算,并区分大小写字母。字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。 日期型 日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。显示格式:dd-mmm-yyyy;mm/dd/yyyy等等。 变量宽度(Width)、列宽度(Columns) 每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。 变量名标签(Variable label) 变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。 变量值标签(Value label) 变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。 缺失数据(Missing values) 数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为

文档评论(0)

挑战不可能 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档