开元研究为你解析在线调查及常见的缺失数据插补方法.docVIP

下载本文档

39
0
约4.25千字
约 4页
2017-05-03 发布于北京
举报
版权申诉

开元研究为你解析在线调查及常见的缺失数据插补方法.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

开元研究为你解析在线调查及常见的缺失数据插补方法

开元研究为你解析在线调查和常见的缺失数据插补方法在线调查怎样才能使网络调查的回收率达到我们的预期值呢？现在著名的开元研究就为您介绍一些提高网络调查问卷回收率的方法。网络调查问卷设计要简单简洁编辑一个包括几个问题的问卷很容易，编辑一个包含很多问题的问卷也一样很容易。难度在于如何编辑一个简短的精练却涵盖了很多方面的问题的问卷。　设计的问题必须是语义明确，句意简短的句子。对于需要详细说明的问题，我们可以通过链接放入问卷中。选择醒目的字体和背景色，使阅读者易于阅读良好的视觉效果能使被访者人快速的把注意力集中在问卷的正文上，提高调查问卷的答题率。提供有激励性的奖励鼓励怎样才能激励人们填答您的网络调查问卷呢? 不同类型的问卷有着不同的激励方式。　　物质奖励：是对那些您不太熟悉，或对您有收集的信息没有既定兴趣的人群一个最常见有效的方式。物质奖励可以是抽奖的形式。如可以有机会获得新款科技产品，或是直接获得免费的文化衫等。如果您的目的是要这些受访人参与问卷调查，那你所提供回馈的物质则必须是具有大众性和实用性的东西。信息交换：有时侯受访人回答调查问卷的原因就是要看到此问卷调查结果。如果寻访的人群是某协会或贸易组织等时，使用这一激励方法则是非常有效的。行政要求：对员工进行问卷调查时，只要发出相关的行政要求就可以，有时也可以选择不记名调查。责任激励法：多用于对答卷人群强调他们提供回答的重要性。这种方法多用于为受访人群提供某些服务的非赢利机构。要记住的是，任何一个问卷调查都需要某种形式的对受访者的激励机制，并且这些机制必须是根据调查问卷的实质和特定的受访人群而设定的。利用关系人们通常喜欢参与那些对他们有影响的事情, 不管是正面的还是负面的。与受访者毫无关联的问卷调查很难有高的回收率。试想，当一个人收到一个不知哪儿来的问卷，问的又是些和他没有关系的问题，他回答问卷的几率要远远低于对从一个他熟悉的有关系的人或组织那里来的非常个性化的调查问卷。缺失数据插补方法及比较缺失数据的产生在抽样调查中，经常会遇到调查问卷中某些项目没有回答的情况，这就是数据缺失的问题。数据缺失问题无论是在市场调查、政府调查还是学术调查中都呈现越来越严重的趋势。这是由多种原因造成的。公民越来越重视个人的隐私权，不愿意透露一些个人信息；不规范的市场调查影响了调查的严肃性，使得受访者对各类调查不屑一顾；问卷设计的不规范，尤其是市场调查中的各类“搭车调查”使得问卷过长，造成受访者产生厌倦心理；调查单位不重视访问员的培训，访问员缺乏一些必备的补问和查漏基本技巧。缺失数据根据其产生机制可以分为完全随机缺失（MCAR）、随机缺失（MAR）和非随机缺失（MNAR）。完全随机缺失：缺失情况相对于所有可观测和不可观测的数据来说，在统计学意义上是独立的。比如说，受访者在街头接受访问时，突然沙粒吹进了眼睛导致问卷后面的问题无法回答，从而造成了数据缺失。随机缺失：是一个观测出现缺失值的概率，是由数据集中不含缺失值的变量决定的，而不是由含缺失值的变量决定的。非随机缺失：是与缺失数据本身存在某种关联，比如问题设计过于敏感造成的缺失。识别缺失数据的产生机制是极其重要的。首先这涉及到代表性问题。从统计上说，非随机缺失的数据会产生有偏估计，因此不能很好地代表总体。其次，它决定数据插补方法的选择。随机缺失数据处理相对比较简单，但非随机缺失数据处理比较困难，原因在于偏差的程度难以把握。缺失数据的插补是指选择合理的数据代替缺失数据。不同的插补法对总体推断会产生较大的影响，尤其是在缺失数量较大的情况下。目前国内学者对缺失数据的插补问题尚未有充分的认识。笔者发现，研究者在抽样调查报告中很少会说明缺失值的处理方法，但事实上，绝大部分社会科学调查（包括市场调查）都会包含不完整的数据，理应对此有所说明。几种常见的缺失数据插补方法１．个案剔除法(Listwise Deletion) 最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise deletion)，也是很多统计软件（如SPSS和SAS）默认的缺失值处理方法。在这种方法中如果任何一个变量含有缺失数据的话，就把相对应的个案从分析中剔除。如果缺失值所占比例比较小的话，这一方法十分有效。至于具体多大的缺失比例算是“小”比例，专家们意见也存在较大的差距。有学者认为应在5%以下，也有学者认为20%以下即可。然而，这种方法却有很大的局限性。它是以减少样本量来换取信息的完备，会造成资源的大量浪费，丢弃了大量隐藏在这些对象中的信息。在样本量较小的情况下，删除少量对象就足以严重影响到数据的客观性和结果的正确性。因此，当缺失数据所占比例较大，特别是当缺数据非随机分布时，这种方法可能导致数据发生偏离，从而得出错误