- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据录入与数据获取2
数据录入与数据获取 数据是统计的基础,用于分析的数据资料可以是原始资料,需将它们录入SPSS,建立数据文件;另一种是已经被录入其他数据格式的资料,需要将其内容直接读入SPSS中。 一、数据格式 1、统计软件中数据录入格式的基本原则 不同观察对象的数据不能在同一条记录中出现,即同一观察数据独占一行 每一观察指标或影响因素只能占一列,即同一指标录到同一变量中去 最终数据集应包含所有原始数据的信息 2、变量属性介绍 1)数据录入三步曲: 定义变量名,给每个变量起名,已突破8个字符的限制,最多可达64个字符,但为了与其他软件能进行有效数据通讯,建议用英文或加数字,且以8字符为限 指定变量属性,指定每个指标的统计特性,如变量类型、宽度、小数位数等。 录入数据,把每个记录的各指标录入为电子格式 定义变量名应遵循的原则如下: (1)首字符必需是英文或汉字,不能以下划线“_”或圆点“.”结尾。 (2)变量名不能使用SPSS的保留字有ALL、AND 、BY 、OR 、NOT 、EQ 、GE 、GT 、LE 、LT 、NE 、TO 、WITH (3变量名中不能有空格或某些特殊符号,如“!” 、“?”和“*” (4)系统中不区分变量名中的大小写字符。 (5)变量名称最好以能够代表该数据意义的文字来命名,如此提高变量的可读性。如可以使用staffno来代表职员代号的变量名称,比使用no来表示更清楚明了。 2)变量的存储类型type 数值型:标准数值型numeric、逗号数值型comma、圆点数值型dot、科学记数法型scientific notation、美元数值型dollar、用户自定义型custom currency(六种) 字符型:默认显示8个字符位,区分大小写,不能进行数学运算,在数据处理过程中用引号引起来,但录入时不加引号 日期型:系统给出多种显示方式,但存储的是该时间与1582年10月14日零点相差的秒数,故早于该时间无效 3)变量的测量尺度measurement 统计学中的分类 定类尺度nominal(无序分类)可以是数值型,也可以是符型变量。 定序尺度ordinal(有序分类)可以是数值型,也可以是符型变量。 定距尺度interval(连续性变量):是对事物类别或次序之间间距的测度,只能进行加减运算,没有绝对的0,即0并不表示没有,如温度 定比尺度scale (连续性变量):能够测算两个测度值之间的比值,有绝对0,可进行加减乘除运算 SPSS将后两者合并为scale 4)变量名与变量值的标签 label用于对变量名的进一步解释,标签会在结果中输出,方便阅读 Value labels:对变量取值含义的解释说明,对定序和定类变量不可少,分析结果以相应的标签出现,data view中,view ?value labels,显示结果,且可检查有无数据录入错误 5)缺损值missing value 系统缺失值:数值型为圆点“.”,字符型是空字符串,录入时跳跃亦为此 用户自定义:如调查表中的9,99等表示不知道或拒绝回答,此时应将该值定义为缺失值。 用户自定义有三种定义方式可选:无,三个离散值discrete missing value, 范围加一个离散值range plus optional discrete miss 二、数据的直接录入 1、操作界面 打开系统会生成空的数据文件 两个界面:data view, variable view 定义完变量后,可直接在数据视图页面输入数据 2、开放题和简单单选题的录入 以P28例题为例建立数据库 1,3,5,9是开放题,直接输入,字符串中宽度最多为256字符 2,4,6单选题录入方式同前,但可通过定义变量值标签,减少录入工作,且方便今后的分析。即可采用:字符直接录入、字符代码+标签值、数值代码+标签值等三种方式。 首选:数值代码+标签值 3、多选题(多重应答)的录入 7,8是多重选择题,不能直接编码,需要使用几个变量来进行记录 多重二分法multiple dichotomy method:在编码的时候,对应每一个选项都定义一个变量,且均为二分类,变量值标签定义一致,录入方式同单选,录入完毕,需定义多选题集 多重分类法multiple category method:利用多个变量对一个多选题答案进行定义 分析前需要先定义多选题集,然后才可把多选题的全部变量当成一道题分析 通过以下两方式实现多选题分析 Tables模块 Multiple response菜单:不能保存定义的信息 三、外部数据的获取 三种方式:直接打开、利用文本向导读入文本数据、利用数据库ODBC接口读取数据 1、可直接打开的数据类型:16种 以Excel 为例,若用复制+粘贴,可使字符型数据变为缺损值 2、文本数据导入:按提示进行 Fi
文档评论(0)