第8-章调查的整理题库.pptVIP

下载本文档

1584
0
约7.09千字
约 59页
2016-12-21 发布于湖北
举报
版权申诉

第8-章调查的整理题库.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

五、后设计编码开放题编码：将问题转化为一个或几个变量，将所有可能的答案类别赋予相应代码。根据问题的回答确定各答案类别。选取问卷有两种方式：阅读所有问卷对该问题的回答，这种方法适用于样本量较小的情况；抽取部分问卷，抽取方法可以随机选取，也可以分层系统选取，还可以主观选取，此方法适用于样本量较大的情况。开放题编码选定问卷后，仔细阅读每个被调查者对该特定问题的回答，每遇到一个新的答案类别就记录下来，同时记录各答案类别出现的频数，依次类推。这里要注意的是答案除表面含义以外，可能还有引申、隐含的含义，应注意区分。最后结合调查分析目的对分类的要求，对各答案类别进行整理归纳，突出分析重点，尽量包含所有信息且互不交叉，将不能编码或个数较少、可不予考虑的答案归入“其他”项。此外，注意留出位置准备修改，如果后期发现较多或较重要、有新意的类别，可以增加或细化类别。开放题编码您为什么不考虑未来两年不买该产品？太大，厨房进不去买不起外观丑陋不喜欢其颜色，太贵听说不可靠我们家只有两个人，不需要我预期会降价，到时候再买使用起来太复杂不知道产品设计成本因素不可靠不需要不知道五、后设计编码无结构问卷：首先看有无必要编码无结构问卷编码步骤：（1）确定变量，定义问卷变量（2）针对各变量，分别确定答案类别，定义代码六、编码表的设计原则准确性便利性完整性唯一性有效率标准化维护性七、实践中的编码技巧设计问卷时，答题说明尽量详细一些便利性针对模棱两可的问题时，制定统一标准尽量保证编码表的质量，避免由编码表引起的编码误差在编码表中编入“其他”项，如果该答案比较重要或出现频率较多，可以通过增加、细分答案类别，修改编码表，做好编码人员的选择、培训、监督、审核工作。八、调查资料的录入 KEY-IN 键盘录入，扫描、光标阅读器数据录入软件：文本软件：文件小，操作简单试算表软件：分栏，审核，简单分析数据库软件：专业储存，录入界面统计软件：统计分析。八、调查资料的录入 KEY-IN 第三节调查数据的清洁和预处理一、调查数据的清洁 1.一致性检查和逻辑检查：变量的取值是否超出合理范围有无逻辑错误有无极端值。一、调查数据的清洁 2.缺失数据的处理将有缺失值的个案整个删除：数在样本量很大、有缺失数据的个案比例较小，而且有缺失数据的个案与无缺失据的个案在分布上无显著差异时使用。将有缺失值的个案保留，仅在计算时删除相应变量的缺失值：当样本量较大、缺失数据较少且变量间不是高度相关的情况下使用。插补法：均值替代、回归估计、随机抽取、最近距离确定等方法用一个样本统计量的值去代替缺失值用一个统计模型计算出来的值去代替缺失值加权组调整法：就是通过对调查中的回答数据使用加权因子，从而对数据进行调整，减少缺失值的影响二、加权处理加权就是给每个被调查者（个案）赋予一个权重，该权重可以反映该被调查者（个案）相对于其它被调查者（个案）的重要性。权重越大，相应的被调查者（个案）越重要。权重为1相当于没有加权。使用加权预处理时，一定要慎重对待，并在报告中提供加权处理的方法以及处理的结果。二、加权处理设计权数：样本单元入样概率的倒数简单随机抽样分层抽样多阶段抽样权数的结构调整主要指调查现场出现与抽样设计不同情况，为了保证抽样设计方案的落实而进行的某些权数调整权数的无回答调整调整的思路是把无回答单元的设计权数在回答单元之间进行重新分配最终权数最终权数 =设计权数×结构调整系数×无回答调整系数二、加权处理例如，某项拦截访问面访了300位大学生，目的是了解北京市大学生使用手机的情况。由于样本中女生占了60%，因而样本是有偏的。这并不是一个严格的随机样本，因此不适合作统计推断。但是研究人员仍然希望从资料中获取尽可能多的有关大学生使用手机的信息。为此，根据北京市大学生的性别分布，对样本进行了加权处理，其中的加权系数或权重等于对应的总体比例除于样本比例（如下表所示）。二、加权处理男 40.0 60.0 1.5 女 60.0 40.0 0.67 性别样本（％）总体（％）权重合计 100.0 100.0 ? 通过加权处理使样本更具代表性二、加权处理三、变量的转换 1.变量重新定义，如改变数据的测量水平，把定距、定比变量转为定序、定类变量。 60岁以上＝4 40-59＝3 20-39＝2 20岁以下＝1 变量重新定义把资料合并为更少的几个大类三、变量的转换 2.变量转换