社会调查研究方法(普通高等教育“十五”国家级规划教材;21世纪社会学系列教材) 教学课件 作者 郝大海 著 第八章 数据处理.pptVIP

社会调查研究方法(普通高等教育“十五”国家级规划教材;21世纪社会学系列教材) 教学课件 作者 郝大海 著 第八章 数据处理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 数据处理 访问或其他方式搜集到的问卷资料,必须通过一定的数据处理程序,转换成可供计算机分析的数据形式。大体上,调查数据的处理包括资料检查与校订、资料编码、数据录入与整理等几个步骤。 第一节 资料检查与校订 一、资料检查 资料检查是指对调查得到的原始资料质量的审查与核实,目的是要确定哪些资料可以接受,哪些资料要剔除掉。它主要通过对回收问卷的完整性、准确性和真实性的检查来实现。 步骤:检查问卷和回访 二、资料校订 首先,访问员没问某些问题,或没记录某些问题的答案。 其次,访问员的记录字迹不清。 第三,记录的答案模棱两可或含义不清楚。 第二节 资料编码 一、编码的一般规则 资料编码原则上是将被访者对一个问题的回答,分配一个相对应的计算机软件能够识别的代码,这个代码就是代表该项回答内容的编码。 就具体的编码方式而言,研究者可以在问卷设计时事先赋予被访者所可能回答的选项一个代码,编码时只要逐一记录被访者回答的选项代码即可,这种与问卷设计同步进行的编码形式被称为事前编码,或预编码。 研究者也可以在访问结束后,再逐一就受访者的回答进行编码的工作,这种编码方式被称为事后编码。 二、开放题编码技术 在事后编码中,编码员首先要对已出现的各种答案进行分类,即分析每一个答案,将相类似的归并为一类。 其次,代码指南的编制要在设计问卷时就开始,在小组讨论、深入访谈和试调查过程中,研究者要有意识地摘要记录每个不同的答案。 第三,编码时,研究者在为编码员提供每一个编码项目的代码指南的同时,还应该附上几张单页编码纸,将需要编码项目的名称和誊写答案的位置清楚地标在每页的顶端。 最后,对于事后编码来说,如果有两个或多个编码员参与编码工作,那么他们要么在不同的时间进行编码;要么同时在同一地点,依照同一编码手册进行编码。 三、编码手册 在对资料进行编码时,必须事先制订详尽的计划和明确的规则,通常需要编制一份编码手册,用来记载资料数量化的所有格式、内容,以及使用计算机资料的具体步骤。事前编码和事后编码所用的编码手册最后将合并为一个编码手册。 编码手册最直接的作用是提供一套标准化的编码作业程序。 四、特殊题型的编码 所谓特殊题型主要是指复选题和排序题,即被访者可以选取多个答案,或对选出的多个答案进行排序的情况。与单选题编码相比,这两类题型的编码稍有些复杂,而且相应的统计分析也需要特别的软件指令。 (一)复选题的编码 在调查研究中,研究者经常要求被访者针对某一问题在多个答案选项中进行复选,  (二)排序题的编码 要求被访者从几个答案选项中选择的答案不止一个,所以具有复选题的特性;与此同时,又由于要求被访者对选项排出顺序,故每一个被选中的答案选项,其排序位置有1、2或3多种可能,这样在实际编码和统计分析中,排序题与复选题有其相似之处,但排序题会显得更复杂些。 第三节 数据录入与整理 资料编码完成后,就可以进行数据的计算机录入和数据文件的整理工作了。数据录入是将问卷资料所对应的代码扫描或用键盘直接输入计算机磁盘,建立起数据文件。而数据文件整理包括数据清理和缺失值的处理,前者是利用统计软件查找数据错误;后者则是通过分析,有效地对缺失值予以补救。 一、决定录入方式和软件 数据录入目前大致采用三种方式进行:人工输入、计算机辅助系统转换和光电输入。 计算机辅助系统转换和光电输入一般都是用与设备配套的软件。而人工输入无论是直接录入,还是登录表转录,都有许多通用的软件可以选择。 二、人工录入的注意事项 第一,在正式录入开始前,研究者必须统一规定需要录入的资料内容和数据录入格式。 第二,要对数据录入人员进行培训,绝不能假定会计算机操作的人员就懂得如何进行数据录入。 第三,数据录入中的工作要点 三、数据清理 (一)可能数值清理 可能数值清理是针对每一个变量,检查它是否有超出合理范围的数值。 (二)一致性清理 一致性清理涉及数据结构的检查,通常会牵涉两个或两个以上变量。所谓逻辑不一致数值,是指两个或两个以上变量之间出现了逻辑上彼此互斥的数值。 四、缺失值的处理 (一)缺失值的分析 对于系统性缺失,研究者应先不要简单地对缺失值进行填补或估计,而是进行缺失分析。具体做法是,运用一个虚拟变量,将发生缺失的样本归为一类,然后与其他没发生缺失的样本进行对比 如果二者在一些重要的统计量上,具有显著差异,则研究者应该修改问卷或研究设计,重新进行调查。如果没有条件修正研究过程,则研究者应该在调查报告中,诚实地交代这一系统性缺失的发生原因和可能的影响。 (二)缺失的预防 首先,在编制问卷阶段,可以考虑在答案选项中,安排“其他”这种开放式选项,这样被访者在答案选项中找不到适合自己的情况时,就可以在“其他”选项中,写出自己的答案。 其次,在数

您可能关注的文档

文档评论(0)

时间加速器 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档