第十章 非抽样误差(抽样理论与方法,河南财政学院).pptVIP

第十章 非抽样误差(抽样理论与方法,河南财政学院).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 非抽样误差(抽样理论与方法,河南财政学院)

10.1 非抽样误差的主要来源与分类 一、 非抽样误差的分类: 1.抽样框误差:由于不完善的抽样框引起的误差。 2. 无回答误差:由于没有获得样本单元的需调查的数据而引起的误差。 3.计量误差:调查所获得的数据与调查项目的真值之间不一致而引起的误差。 二、 非抽样误差的特点: 与抽样误差相比,具有 1.非特有性 2.非一致性 3.难测定性 4.难评价性 5.全过程性 10.2 抽样框误差 一、 抽样框误差 1.丢失目标总体单元; 2.包含非目标总体单元; 3.抽样框中的单元与目标总体单元不完全是一一应; 4.复杂抽样框中的辅助信息不完全或不正确。 二、 抽样框误差的影响 1.总和估计。 总体总和的真值 总体总和的估计值 绝对偏倚 则Y的相对偏倚可以写为 其中 2.总体均值 总体均值的估计值 绝对偏倚 则相对偏倚可以写为 其中 三、不完善抽样框的使用 1.调整抽样框 2.使用多个抽样框 设样本取自A、B两个抽样框。这两个抽样框的单元数分 别为NA,NB。两个抽样框将目标总体划分为三个区域。 区域a:其中的单元仅仅与抽样框A有联系,单元个数为Na;方差 区域b:其中的单元仅仅与抽样框B有联系,单元个数为Nb;方差 区域ab:其中的单元与抽样框A,B均有联系,单元个数为Nab。方差 现采用简单随机抽样,从A,B框中分别抽出容量为nA,nB的 两个样本。利用抽样框A的样本对区域a和区域ab进行事后 分层的总和估计分别为: na与nab为落入区域a和区域ab的样本单元数; yA(a)和yA(ab)为区域a和区域ab的样本观测值总和。 利用抽样框B的样本对区域b和区域ab进行事后分层的总和 估计分别为: nb与nab为落入区域b和区域ab的样本单元数; yB(a)和yB(ab)为区域b和区域ab的样本观测值总和。 目标总体的总和估计为: WA和WB为适当选取的权数,且WA+WB=1 若nA和nB都足够大,且修正系数fpc忽略不计 式中α,β分别为重叠部分的单元占抽样框单元的比例, 即 结合调查费用确定各个抽样框的样本量nA,nB和权数WA 在总费用给定条件下使方差最小的最优抽样比为 10.3 无回答误差 一、无回答误差的分类: 单元无回答 项目无回答 二、无回答误差的原因: 有意识的无回答 无意识的无回答 总体均值 总体均值的估计值 绝对偏倚 则相对偏倚可以写为 1.汉森-赫维茨的再抽样调整 总体均值的估计值 费用函数为 例:第一个样本用邮寄方式取得,预计回答率为50%。希望达到的精度月容量为1000的简单随机样本(全部回答)所达到的精度一样。邮寄一张问卷的费用是0.1美元。派人作一次上门调查的费用为4.10美元。应当寄出多少份问卷?对不回答者派人上门调查 的百分比试多少?(假定 ,且N很大) 解: 根据精度要求 2.波利茨(Politz)与西蒙斯(Simmons)加权调整 假定访问是在每周除星期日以外的其余6个晚上进行,对每个样本户只进行一次访问,在访问时顺便问了被调查者前5个晚上(不包含星期日)是否在家。 令ti为前5个晚上在家并可接受调查的天数。 估计 作为该调查户回答概率Pi的 如果按t值的大小(t=0,1,2,3,4,5)将调查数据分成6组,记第t组的观察值的平均数为 ,频数为nt 总体均值的估计值 3.相关推估法 4.插补调整 10.4 敏感性问题调查 与随机化回答技术 一、 敏感性问题: 指所调查的内容涉及私人机密而不愿或不便于公开表态或陈述的问题。 二、沃纳随机化回答模型 例:某大学欲调查本科生考试作弊现象。从本科生中抽取100个学生进行调查。在一个密闭容器中有完全相同的三个球,其中有2个红球,1个白球。抽中红球就回答问题1,抽中白球就回答问题2。设计的问题为: 问题A:你在考试中有过作弊行为,对吗? 问题B:你在考试中从没有作弊行为,对吗? 在100个学生中有35个学生回答是。 试估计该大学本科生考试作弊的比例πA。 解:P(是)=2/3 πA +1/3 (1-πA ) 三、西蒙斯随机化回答模型 例:某大学欲调查本科生考试作弊现象。从本科生中抽取100个学生进行调查。在一个密闭容器中有完全相同的三个球,其中有2个红球,1个白球。抽中红球就回答问题1,抽中白球就回答问题2。设计的问题为: 问题A:你在考试中有过作弊行为?

文档评论(0)

ajgoaw + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档