10-数据准备案例介绍.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10章 数据准备 Data Preparation 内容提要 问卷审核与编辑 数据编辑 编码 数据录入 数据清理 数据文件的准备 数据分析策略的选择 数据准备过程 一、问卷的审核(Questionnaire checking) 应尽早对问卷进行必要的审查,以便及时发现问卷填写中存在的问题并采取矫正措施。应注意: 填写对象是否合格 填写是否认真 不完整,缺失项 ,缺页 逻辑错误 不符合要求的跳跃 其他异常现象 二、问卷编辑校订(Questionnaire Editing) 如果发现不正确的回答,可以考虑采取以下的步骤: 给出估算值 设为缺失值 丢弃整个问卷 返回给调查员 事先明确问卷填写的要求及处理措施极为重要。 丢弃整个问卷的原因 要丢弃的问卷数很少(10%); 样本量较大; 不合格的问卷与合格的问卷没有差异; 人口统计特征,产品使用特点等 不合格的问题占很大比例; 对关键问题没有回答。 是否丢弃问卷的决定往往是主观的,要在报告中加以说明。 问卷返回的原因 通常在下列情况下,应考虑将问卷退回。 填写不认真 填写不完整 差异很小 太多的逻辑错误 被调查者不符合要求 数据编辑 数据编辑是指纠正数据文件中发现的错误和矛盾之处。 在数据编辑的过程中,我们需要: 填写缺失项 纠正逻辑错误 检查跳跃模式 问题1: 逻辑矛盾. 1. 年龄: 15 . 2. 婚姻状况: 未婚 X 已婚 其它 问题 2 : 没回答. 1. 年龄: . 2. 婚姻状况: 未婚 X 已婚 其它 解决办法 1. (大样本) 删除整个问卷. 2. 将缺失数据与矛盾数据看成没回答,但保留其他项目 3. (小样本) 调整答案或用均值/众数代替。 数据编辑:修正问题 联系整个问卷的内容: 1. age: 15 . 2. Marital Status: Single X Married Others 3. Job: College Student X Secondary School Student 用均值或众数代替: 1. Age: ? . 2. Marital Status: Single ? Married Others 数据文件 在产生数据集时应养成准备必要的数据文件的良好习惯。以下数据文件通常应与数据集一起提供: 数据字典 原始问卷 样本设计的信息 研究总体的背景信息 其他必要的信息 三、编码(Coding) 编码是根据问卷中所含信息及预先设计好的编码规则将每一个观察变量赋予相应的数值的过程。 例:文化程度 小学及以下 1 初中 2 高中 3 大学 4 研究生 5 编码规则 编码的规则如下: 相互独立且具有完备性 观察变量具有一致性 符合常识 粗细适宜 例:请问您本公司手机的总体评价? 很好 1 较好 2 一般 3 例:婚姻状况的编码 未婚 1 已婚 2 离异 3 丧偶 4 其他 5 对封闭问题的编码 1.? 你的家庭拥有几辆车? 1 . 编码: 用实际数字; 9 = 无回答. 2. 你家有旅行车吗? X Yes No 编码: = 9 无回答. 多选项的编码 例:希望配置的楼内公共设施: 1=每层有自助式洗衣机, 2=每层有活动间, 3=公共浴室, 4=开水房, 5=其他 对开放问题的编码 Q3: What are the main reasons that you bought a station wagon? Step 1: 给出一系列可能

文档评论(0)

5201394 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档