7资料的处理.pptVIP

  • 1
  • 0
  • 约1.95千字
  • 约 12页
  • 2018-10-19 发布于浙江
  • 举报
7资料的处理

能力单元七:资料的处理 学习目标: 培养资料处理能力 一、原始资料的审核与复查 (一)审核 1、实地审核 2、系统审核 实地审核的优点是特别及时,且效果较好;其不足是调查工作的组织和安排要特别仔细,调查员个人处理各种情况的能力要比较强。 系统审核的优点是调查工作便于统一安排和管理,审核工作也可以统一在研究者的的指导下进行。审核的标准比较一致,检查的质量也相对好一些;不足是整个调查工作的周期则会相对拉长,少数个案的重新询问和核实工作有时因时间相隔较长而无法落实。 (二)复查 所谓资料的复查,指的是研究者在调查资料收回后,又由其他人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调查的质量。 基本做法:由研究者自己或是由研究者重新选择另外的调查员,从原来的调查员所调查过的样本中,随机抽取5%-15%的个案重新进行调查。 目的: 1.核实原来的调查员是否真的对个案进行过调查; 2.将两次调查的结果进行对比,以检查第一次调查的质量。 作用:发现并纠正原始资料中所存在的一些错误,还可以普遍了解整个资料收集工作的质量。 二、资料的编码和录入 (一)问卷的编码 1、编码的含义 就是给每个问题及答案一个数字作为它的代码。也即将问卷中的文字答案转换成数字的过程。 预编码:问卷设计的同时就设计好,是问卷的一部分。 后编码:调查完成后再进行的编码。 2、编码的过程与方法 答案代码 代码宽度 栏码 编码 (1)答案代码的确定 ①填空式问题——直接用回答者所填写数字作为答案的代码值。 如:您的年龄是 32 岁。 ②二项选择问题或多项选择问题—答案预编码作为代码值。 如:您的性别是:(①) ①男 ②女 ③矩阵式或表格式问题——资料收回后对回答进行后编码。 习惯上,0作为缺省值的代码;9作为特殊值的代码。 如: 我们可对表中的答案分别赋值为: 1=不严重,2=不太严重,3=比较严重,4=很严重,9=不清楚。 不严重 不太严重 比较严重 很严重 不清楚 噪音 烟尘 污水 垃圾 (2)代码宽度的确定 项目或问题答案最大代码的位数。 (3)问题栏码的确定 即给每一个问题分配栏码,指定该问题的编码值共几位,以及它们在整个数据文件中所处的位置。 如: 项目或问题 宽度 栏码 你的性别:①男 ②女 1 1 你的年龄:__岁 2 2-3 你的文化程度: 1 4 ①小学及以下 ②初中 ③高中及中专 ④大专及以上 您的月收入为 元 4 4-7 …… (4)编码 (二)数据录入 1、数据录入方式 方式一:直接从问卷上将编好码的数据输入计算机。 方式二:先将问卷上编好码的数据转录到专门的登录表上,然后再从登陆表上将数据输入计算机。 2、数据输入软件 一类:一般性的编辑软件,如ED,Word star, WPS,Word等,输入后得到文本格式的文件。 二类:专门的数据库管理软件,如dBase、FoxBASE、FoxPro等,输入后得到后辍为.DBF的数据文件。 三类:直接在SPSS中输入数据。 三、数据清理 (一)有效范围清理 对于问卷中的任何一个变量来说,它的有效的编码值往往都有某种范围,而当数据中的数字超出了这一范围时,可以肯定这个数字的定是错误的。 1、错误来源有四: 来自于被调查者(乱填写或误填写); 来自于编码员 (编码错误); 来自于录入员 (输入错误); 来自于登录员 (登录错误)。 2、处理方法 根据个案编号找出原始问卷进行核对。如果错误来自被调查者(即原始问卷本身有误),那么就将该问题的回答作为缺省值处理;如果在同一份问卷中,错答、乱答现象不止一两处,则可将整份问卷作为废卷处理。 (二)逻辑一致性处理 1、其基本思路是依据卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的合理性。 2、例如,相倚问题的逻辑一致性 过滤性问题是:“你有孩子吗?” a.有 b.无 后续性问题是:“你的孩子今年多大?”---岁 如果前一问题的回答为“无”,编码为2,则后一问题中的回答应该是空白(即为缺省值,用0来表示),即不需要回答。如果统计中出现了1、2、3、4、5、6、7、8、9、10等数字,那就说明这些数字有问题。 调查资料编码练习,录入、清理上机操作。 实作:  掌握资料处理的主要流程和具体方法 小结:

文档评论(0)

1亿VIP精品文档

相关文档