- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 数据处理 新编21世纪社会学系列教材 基本概念 数据处理 ◇ 资料检查 ◇ 资料校订 ◇ 数据文件 ◇ 编码 ◇ 事前编码 ◇ 边缘编码◇ 事后编码 ◇ 编码手册 ◇ 栏位 ◇ 登录表 ◇ 资料录入 ◇ 条形码判读器 ◇ 光电扫描仪 ◇ 数据清理 ◇ 可能数值清理 ◇ 一致性清理 ◇ 缺失值 ◇ 系统性缺失值 ◇ 平均值估计法 ◇ 回归估计法 第八章 数据处理 第一节 资料检查与校订 第二节 资料编码 第三节 数据录入与整理 第一节 资料检查与校订 资料检查 一 第一节 资料检查与校订 资料校订 二 1.检查问卷 2.回访 在实际访问中, 访问员的违规或舞弊行为主要表现为以下几类: 首先, 没有按规定访问指定的被访者。 其次, 用电访或邮寄代替面访。 再次, 故意漏问某些较敏感或较难问的题目。 最后, 自己填答问卷。 (一)资料检查 一 为了提高问卷质量,对那些经过初步检查的问卷,还要进行校订工作,即从问卷中找出那些错误或不令人满意的答案,并对之进行相应的处理。 (二)资料校订 二 访问员没问某些问题,或没记录某些问题的答案 访问员的记录字迹不清 记录的答案模棱两可或含义不清楚 访问员在规定跳题的地方没跳, 或在不该跳题的地方却跳了。 第二节 资料编码 编码的一般规则 一 第二节 资料编码 开放式题目的事后编码技术 二 编码手册的编制 三 特殊题型的编码 四 资料编码原则上是将被访者对一个问题的回答,分配一个相对应的计算机软件能够识别的代码,这个代码就是代表该项回答内容的编码。 思考:除了确定编码方式外,编码时特别需要注意哪些? (一)编码的一般规则 一 1.在编码的过程中,除了要对被访者每一个回答的选项进行编码外,还需对问卷编号、访问员编号等相关内容依统一标准进行编码,这样做可以为查找问卷错误提供极大的便利。 2. 如果被访者的回答内容本身就是一些数字资料,如被访者的年龄、收入等, 在编码时应尽可能保留原来资料的面貌, 以使资料的使用者有更大的空间自己处理所需要的变量类型。 3.对于“不确定”、“不知道” 或 “其他” 这样的特殊选项,在编码设计时要使用固定的代码,如 “9 8”、“9 9 8” 等,最好在整份问卷中都完全一致。此类代码前后一致性程度越高,录入时出错的可能性就越小。 一 开放式题目和封闭式题目中的“其他” 选项,由于是被访者用自己的话来回答问题,故答案的范围无法事先预知,一般采取事后编码。在事后编码中,编码员第一要对已出现的各种答案进行分类,即分析每一个答案,将相类似的归并为一类。 (二)开放式题目的事后编码技术 二 1.研究者应该针对每一个需要事后编码的项目给出一份代码指南。 2.代码指南的编制要在设计问卷时就开始,在焦点小组讨论、 深度访谈和试调查过程中,研究者要有意识地摘要记录每个不同的答案。随后将所有不同的答案做成分类表,并给每个答案建立草拟的代码,从而形成初步的代码指南。 3.编码时,研究者在为编码员提供每一个编码项目的代码指南的同时,还应该附上几张单页编码纸, 将需要编码项目的名称和誊写答案的位置清楚地标在每页的顶端。 (二)开放式题目的事后编码技术 二 4.对于某个分类含义不十分清晰的答案,究竟是将其合并到已有的类别中去,还是设立一个新代码呢? 一般而言,有经验的编码员通常会选择后一种策略。 5.对于事后编码来说,如果有两个或多个编码员参与编码工作,那么他们要么在不同的时间进行编码,要么同时在同一地点,依照同一编码手册进行编码。 第五节 方法选择的考虑因素 成本 总体与抽样 一 二 第五节 方法选择的考虑因素 五 四 三 调查周期 调查内容 问卷回收率 六 资料质量 (一)成本 一般情况下,四种资料搜集方法中,网络调查的成本最低,其次是邮寄问卷调查、 电话访问,当面访问的成本最高。 因此,当经费不足,又希望利用问卷资料进行研究时,就应该选择网络调查或邮寄问卷来搜集资料。网络调查借助网络的广覆盖、强互动实现调查问卷的收发,方便高效,成本低,目前已经成为广为使用的一种调查法。 一 (二)总体与抽样 选择资料搜集方法, 除了要受到经费的限制外, 很大程度上还要受到抽样总体的制约。 这方面主要有两点考虑, 一是抽样总体的教育水平, 二是抽样总体参与调查的兴趣和动机。 另一个与抽样总体相关联的问题是能否获取抽样框。 二 调查周期、调查内容 不同的资料搜集方式, 所耗费的时间也有所不同。 一般说来, 自填问卷的调查时间最长, 其次是当面访问, 电话访问的时间最短。 网络调查的周期弹性比较强。 调查内容对选择资料搜集方式的影响有两点, 一是敏感性程度, 二是复杂
文档评论(0)