- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
牌子表的编码设计 牌子表是记录产品品牌的统计表。 它是一种编码表,在涉及产品品牌的问题时有助于被调查者回答,访问员提问和记录。 牌子表中给出所有可能答案选项的代码,使访问员可直接编码。 建立牌子表时应注意及时了解市场情况,加入新品牌,删除消失的品牌。另外,注意“其他”选项的设立,避免出现品牌错误、重码、漏码等错误。 五、后设计编码 数据收集完成后再进行编码设计 实践中主要的应用对象是无结构问卷和结构式问卷中的文字开放题 五、后设计编码 开放题编码:将问题转化为一个或几个变量,将所有可能的答案类别赋予相应代码。 根据问题的回答确定各答案类别。选取问卷有两种方式: 阅读所有问卷对该问题的回答,这种方法适用于样本量较小的情况; 抽取部分问卷,抽取方法可以随机选取,也可以分层系统选取,还可以主观选取,此方法适用于样本量较大的情况。 开放题编码 选定问卷后,仔细阅读每个被调查者对该特定问题的回答,每遇到一个新的答案类别就记录下来,同时记录各答案类别出现的频数,依次类推。这里要注意的是答案除表面含义以外,可能还有引申、隐含的含义,应注意区分。 最后结合调查分析目的对分类的要求,对各答案类别进行整理归纳,突出分析重点,尽量包含所有信息且互不交叉,将不能编码或个数较少、可不予考虑的答案归入“其他”项。 此外,注意留出位置准备修改,如果后期发现较多或较重要、有新意的类别,可以增加或细化类别。 开放题编码 您为什么不考虑未来两年不买该产品? 太大,厨房进不去 买不起 外观丑陋 不喜欢其颜色,太贵 听说不可靠 我们家只有两个人,不需要 我预期会降价,到时候再买 使用起来太复杂 不知道 产品设计 成本因素 不可靠 不需要 不知道 五、后设计编码 无结构问卷:首先看有无必要编码 无结构问卷编码步骤: (1)确定变量,定义问卷变量 (2)针对各变量,分别确定答案类别,定义代码 六、编码表的设计原则 准确性 便利性 完整性 唯一性 有效率 标准化 维护性 七、实践中的编码技巧 设计问卷时,答题说明尽量详细一些便利性 针对模棱两可的问题时,制定统一标准 尽量保证编码表的质量,避免由编码表引起的编码误差 在编码表中编入“其他”项,如果该答案比较重要或出现频率较多,可以通过增加、细分答案类别,修改编码表, 做好编码人员的选择、培训、监督、审核工作。 八、调查资料的录入 KEY-IN 键盘录入,扫描、光标阅读器 数据录入软件: 文本软件:文件小,操作简单 试算表软件:分栏,审核,简单分析 数据库软件:专业储存,录入界面 统计软件:统计分析。 八、调查资料的录入 KEY-IN 本章结构 调查数据的清洁和预处理 3. 调查资料的编码与录入 2. 调查问卷的回收及审核 1. 一、调查数据的一致性检查和逻辑检查 一、调查数据的清洁 1.一致性检查和逻辑检查: 变量的取值是否超出合理范围 有无逻辑错误 有无极端值。 二、缺失数据的处理 2.缺失数据的处理 将有缺失值的个案整个删除:数在样本量很大、有缺失数据的个案比例较小,而且有缺失数据的个案与无缺失据的个案在分布上无显著差异时使用。 将有缺失值的个案保留,仅在计算时删除相应变量的缺失值:当样本量较大、缺失数据较少且变量间不是高度相关的情况下使用。 插补法:均值替代、回归估计、随机抽取、最近距离确定等方法 用一个样本统计量的值去代替缺失值 用一个统计模型计算出来的值去代替缺失值 加权组调整法:就是通过对调查中的回答数据使用加权因子,从而对数据进行调整,减少缺失值的影响 三、异常值诊断与处理 异常值诊断 统计分布法 回归诊断法 戈罗伯斯检验法 四分位数法 三、异常值诊断与处理 异常值处理方法:不能简单采用剔除的方法, 应该先判断可能的产生原因 测量误差。例如:受访者把公里误解为米 人为错误。例如:家庭常住人口数出现55很可能是重复录入5 抽样错误。例如:规模以下企业调查中由于编码错误,抽取了大规模企业 自然异常值。例如:大学生身高调查中可能会访问到身高2米的篮球特长生 三、异常值诊断与处理 异常值处理方法 删除法,适用于抽样错误,及异常值比较少的情况。 缩尾法, 如果排在第k位的数据y(k)至最大值y(n)被认为是离群值,将y(k),…,y(n)均替换为y(k-1)的数值参与计算。 变换变量,比如自然对数变换 降低异常值的权数,使得异常值的影响变小。 插补法,将异常值直接删除,视为缺失数据进行插补处理。 采用对异常值不太敏感的稳健估计量,比如中位数比均值更为稳健,四分位数间距比方差估计量更为稳健 第八章 调查资料的整理 本章结构 调查问卷的回收及审核 1. 调查资料的编码与录入 2. 调查数据的清洁和预处理 3. 第一节 调查问卷的回收及审
文档评论(0)