第8-章调查的整理题库.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
五、后设计编码 开放题编码:将问题转化为一个或几个变量,将所有可能的答案类别赋予相应代码。 根据问题的回答确定各答案类别。选取问卷有两种方式: 阅读所有问卷对该问题的回答,这种方法适用于样本量较小的情况; 抽取部分问卷,抽取方法可以随机选取,也可以分层系统选取,还可以主观选取,此方法适用于样本量较大的情况。 开放题编码 选定问卷后,仔细阅读每个被调查者对该特定问题的回答,每遇到一个新的答案类别就记录下来,同时记录各答案类别出现的频数,依次类推。这里要注意的是答案除表面含义以外,可能还有引申、隐含的含义,应注意区分。 最后结合调查分析目的对分类的要求,对各答案类别进行整理归纳,突出分析重点,尽量包含所有信息且互不交叉,将不能编码或个数较少、可不予考虑的答案归入“其他”项。 此外,注意留出位置准备修改,如果后期发现较多或较重要、有新意的类别,可以增加或细化类别。 开放题编码 您为什么不考虑未来两年不买该产品? 太大,厨房进不去 买不起 外观丑陋 不喜欢其颜色,太贵 听说不可靠 我们家只有两个人,不需要 我预期会降价,到时候再买 使用起来太复杂 不知道 产品设计 成本因素 不可靠 不需要 不知道 五、后设计编码 无结构问卷:首先看有无必要编码 无结构问卷编码步骤: (1)确定变量,定义问卷变量 (2)针对各变量,分别确定答案类别,定义代码 六、编码表的设计原则 准确性 便利性 完整性 唯一性 有效率 标准化 维护性 七、实践中的编码技巧 设计问卷时,答题说明尽量详细一些便利性 针对模棱两可的问题时,制定统一标准 尽量保证编码表的质量,避免由编码表引起的编码误差 在编码表中编入“其他”项,如果该答案比较重要或出现频率较多,可以通过增加、细分答案类别,修改编码表, 做好编码人员的选择、培训、监督、审核工作。 八、调查资料的录入 KEY-IN 键盘录入,扫描、光标阅读器 数据录入软件: 文本软件:文件小,操作简单 试算表软件:分栏,审核,简单分析 数据库软件:专业储存,录入界面 统计软件:统计分析。 八、调查资料的录入 KEY-IN 第三节调查数据的清洁和预处理 一、调查数据的清洁 1.一致性检查和逻辑检查: 变量的取值是否超出合理范围 有无逻辑错误 有无极端值。 一、调查数据的清洁 2.缺失数据的处理 将有缺失值的个案整个删除:数在样本量很大、有缺失数据的个案比例较小,而且有缺失数据的个案与无缺失据的个案在分布上无显著差异时使用。 将有缺失值的个案保留,仅在计算时删除相应变量的缺失值:当样本量较大、缺失数据较少且变量间不是高度相关的情况下使用。 插补法:均值替代、回归估计、随机抽取、最近距离确定等方法 用一个样本统计量的值去代替缺失值 用一个统计模型计算出来的值去代替缺失值 加权组调整法:就是通过对调查中的回答数据使用加权因子,从而对数据进行调整,减少缺失值的影响 二、加权处理 加权就是给每个被调查者(个案)赋予一个权重,该权重可以反映该被调查者(个案)相对于其它被调查者(个案)的重要性。权重越大,相应的被调查者(个案)越重要。权重为1相当于没有加权。 使用加权预处理时,一定要慎重对待,并在报告中提供加权处理的方法以及处理的结果。 二、加权处理 设计权数:样本单元入样概率的倒数 简单随机抽样 分层抽样 多阶段抽样 权数的结构调整 主要指调查现场出现与抽样设计不同情况,为了保证抽样设计方案的落实而进行的某些权数调整 权数的无回答调整 调整的思路是把无回答单元的设计权数在回答单元之间进行重新分配 最终权数 最终权数 =设计权数×结构调整系数×无回答调整系数 二、加权处理 例如,某项拦截访问面访了300位大学生,目的是了解北京市大学生使用手机的情况。由于样本中女生占了60%,因而样本是有偏的。这并不是一个严格的随机样本,因此不适合作统计推断。但是研究人员仍然希望从资料中获取尽可能多的有关大学生使用手机的信息。为此,根据北京市大学生的性别分布,对样本进行了加权处理,其中的加权系数或权重等于对应的总体比例除于样本比例(如下表所示)。 二、加权处理 男 40.0 60.0 1.5 女 60.0 40.0 0.67 性别 样本(%) 总体(%) 权重 合计 100.0 100.0 ? 通过加权处理使样本更具代表性 二、加权处理 三、变量的转换 1.变量重新定义 ,如改变数据的测量水平,把定距、定比变量转为定序、定类变量。 60岁以上=4 40-59=3 20-39=2 20岁以下=1 变量重新定义 把资料合并为更少的几个大类 三、变量的转换 2.变量转换

文档评论(0)

ccx55855 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档