- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章调查中的非抽样误差
第11章 调查中的非抽样误差(non-sampling error);本章结构;学习目标;11.1 引言;非抽样误差的特点;非抽样误差的产生;非抽样误差的分类;11.2 抽样框误差;二、抽样框误差的类型及影响;(二)对抽样框的一些基本认识;(三)抽样框误差的影响;分析;2、对均值估计的影响;分析;三、不完善抽样框的使用;(三)使用多个抽样框
设样本来自A、B两个抽样框,两个抽样框的单元总数分别为NA,NB,目标总体被分成三个部分:区域a、区域b、区域ab
1、利用抽样框A的样本对区域a、区域ab进行事后分层的总和估计为:
2、利用抽样框B的样本对区域b、区域ab进行事后分层的总和估计为:
;3、目标总体的总和估计为:
其中WA,WB为适当的权数,且WA+WB=1
4、估计量的方差近似表达为:
其中,α、β分别为重叠部分的单元占抽样框单元的比例:
;5、结合调查费用来确定各抽样框的样本量na、nb和权数WA
总费用函数为:
在总费用给定的条件下使总方差最小的最优抽样比为:
权数分别为:
;11.3 无回答误差;二、无回答产生的原因及影响;将总体分为“回答层”和“无回答层”
1、总体均值为:
2、从总体中抽取容量为n的简单随机样本,n1来自“回答层”,n0来自“无回答层”,则
用来作为总体均值的估计的偏倚为:
相对偏倚为:
;将总体分为“回答层”和“无回答层”,对总体总量估计带来的偏倚为:
说明:1、总量估计的相对偏倚与均值估计的相对偏倚相等,但绝对偏倚是均值估计绝对偏倚的N倍;
2、导致无回答偏倚的因素有两个:“回答层” 与“无回答层”之间数量的差异 及无回答率R0
3、如果无回答单元与回答单元目标变量的数量特征没有明显的差异,则无回答可以看成是由于随机原因所致,不会造成偏倚,而如果两者不一致,差异越大偏倚就越大。;三、降低无回答的措施;四、对存在无回答数据的调整(了解);(二)加权调整
即通过给每个回答数据赋以不同的权数然后进行数据处理,从而调整由于无回答引起的偏差。
(三)相关推估法
主要用于项目无回答时。思路是寻找与无回答问题变量有关联的其他调查问题变量,利用调查数据建立起变量之间的回归方程,对项目无回答变量值进行推估。
(四)插补调整
是指在数据整理阶段利用调查结果,采用一定的方式为无回答的缺失值确定一个合理的估计值,插补到原缺失数据的位置上。
实际中一般涌均值插补。;补充:敏感性问题调查与随机化回答技术;沃纳随机化回答模型;具体操作;沃纳模型的估计量;例题;西蒙斯随机化回答模型(无关问题的随机化回答模型);例如:问题1:你在期末考试中曾作过弊,对吗?
问题2:你父亲的生肖属牛,对吗?( )
在n个被调查者中,有m个人回答“是”,那么:
;例题;解:n=800,m=420,p=0.5,
;采用随机化回答技术应注意的问题;11.4 计量误差;其中,被调查者误差分为两类:
(1)无意识误差
主要表现为回忆误差,是对被调查的内容记忆不清而回答失真,无意识误差还包括“倾向性数字”。
(2)有意识误差
大多是由于问题的敏感或其他因素使回答具有某种倾向性。如:对收入、学历、职称等回答会偏高,对应纳税额会偏低。
无意识误差可以看成是随机的,不会带来估计偏倚,但有意识误差存在倾向性,会带来估计偏倚。;减少计量误差的措施;11.5 离群值的检测和处理;三、离群值的确认;最流行的检测办法是利用四分位数法,利用中位数测度集中趋势、利用四分位域测度离散趋势,因为这两个测度值对离群值都不太敏感。
上、下四分位域:
您可能关注的文档
最近下载
- DB41T 2431-2023 重点区域地质灾害风险调查评价规范(1:10000).docx VIP
- 2012 INTERNATIONAL BUILDING CODE (2012年国际建筑规范).pdf VIP
- 金龙湖养老度假基地可行性报告.doc VIP
- 光伏发电工程施工规范.docx VIP
- 渗透检测工艺规程.pptx VIP
- 质量员考试(市政质量)基础知识试卷真题(2025年新版附解析).docx VIP
- 幼儿园课件:变焦PPT.ppt
- KEF音响无线HiFi扬声器LS50 Wireless II用户手册.pdf VIP
- 一种低气味、低刺激双固化胶粘剂及其制备方法.pdf VIP
- 设计机构设置和岗位职责.docx VIP
文档评论(0)