网站大量收购独家精品文档,联系QQ:2885784924

第11章 调查中的非的抽样误差.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 调查中的非的抽样误差

第11章 调查中的非抽样误差 (non-sampling error);本章结构;学习目标;11.1 引言;非抽样误差的特点;非抽样误差的产生;非抽样误差的分类;11.2 抽样框误差;二、抽样框误差的类型及影响;(二)对抽样框的一些基本认识;(三)抽样框误差的影响;分析;2、对均值估计的影响;分析;三、不完善抽样框的使用;(三)使用多个抽样框 设样本来自A、B两个抽样框,两个抽样框的单元总数分别为NA,NB,目标总体被分成三个部分:区域a、区域b、区域ab 1、利用抽样框A的样本对区域a、区域ab进行事后分层的总和估计为: 2、利用抽样框B的样本对区域b、区域ab进行事后分层的总和估计为: ;3、目标总体的总和估计为: 其中WA,WB为适当的权数,且WA+WB=1 4、估计量的方差近似表达为: 其中,α、β分别为重叠部分的单元占抽样框单元的比例: ;5、结合调查费用来确定各抽样框的样本量na、nb和权数WA 总费用函数为: 在总费用给定的条件下使总方差最小的最优抽样比为: 权数分别为: ;11.3 无回答误差;二、无回答产生的原因及影响;将总体分为“回答层”和“无回答层” 1、总体均值为: 2、从总体中抽取容量为n的简单随机样本,n1来自“回答层”,n0来自“无回答层”,则 用来作为总体均值的估计的偏倚为: 相对偏倚为: ;将总体分为“回答层”和“无回答层”,对总体总量估计带来的偏倚为: 说明:1、总量估计的相对偏倚与均值估计的相对偏倚相等,但绝对偏倚是均值估计绝对偏倚的N倍; 2、导致无回答偏倚的因素有两个:“回答层” 与“无回答层”之间数量的差异 及无回答率R0 3、如果无回答单元与回答单元目标变量的数量特征没有明显的差异,则无回答可以看成是由于随机原因所致,不会造成偏倚,而如果两者不一致,差异越大偏倚就越大。;三、降低无回答的措施;四、对存在无回答数据的调整(了解);(二)加权调整 即通过给每个回答数据赋以不同的权数然后进行数据处理,从而调整由于无回答引起的偏差。 (三)相关推估法 主要用于项目无回答时。思路是寻找与无回答问题变量有关联的其他调查问题变量,利用调查数据建立起变量之间的回归方程,对项目无回答变量值进行推估。 (四)插补调整 是指在数据整理阶段利用调查结果,采用一定的方式为无回答的缺失值确定一个合理的估计值,插补到原缺失数据的位置上。 实际中一般涌均值插补。;补充:敏感性问题调查与随机化回答技术;沃纳随机化回答模型;具体操作;沃纳模型的估计量;例题;西蒙斯随机化回答模型 (无关问题的随机化回答模型);例如:问题1:你在期末考试中曾作过弊,对吗? 问题2:你父亲的生肖属牛,对吗?( ) 在n个被调查者中,有m个人回答“是”,那么: ;例题;解:n=800,m=420,p=0.5, ;采用随机化回答技术应注意的问题;11.4 计量误差;其中,被调查者误差分为两类: (1)无意识误差 主要表现为回忆误差,是对被调查的内容记忆不清而回答失真,无意识误差还包括“倾向性数字”。 (2)有意识误差 大多是由于问题的敏感或其他因素使回答具有某种倾向性。如:对收入、学历、职称等回答会偏高,对应纳税额会偏低。 无意识误差可以看成是随机的,不会带来估计偏倚,但有意识误差存在倾向性,会带来估计偏倚。;减少计量误差的措施;11.5 离群值的检测和处理;三、离群值的确认;最流行的检测办法是利用四分位数法,利用中位数测度集中趋势、利用四分位域测度离散趋势,因为这两个测度值对离群值都不太敏感。 上、下四分位域:

文档评论(0)

ayangjiayu1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档