- 1、本文档共67页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章 非抽样误差;本章要点; 第一节 非抽样误差构成;一、非抽样误差的来源;◆在抽样方案设计阶段,非抽样误差的来源:
(1)抽样框的编制与准备不够充分完善;
(2)问卷设计不够科学合理。
◆在数据收集阶段,非抽样误差的来源:
(1)调查数据的残缺;
(2)调查数据的错误。
◆在数据处理阶段,非抽样误差存在于对调查资料的整理、分组、计算、编码和计算机录入等过程中,是一种工作上的差错。 ;◆把上述三个阶段的各种非抽样误差加以归纳,可以概括为抽样框误差、无回答误差和计量误差三类。; 二、非抽样误差的特点; 第二节 抽样框误差分析;一、抽样框误差的成因;二、抽样框误差的影响 ;(1)丢失单位是目标总体中的一个随机样本,具有与目标总体相同的期望与方差,则其对总体均值的估计影响不大,但对总体总值的估计会低估。;;(2)丢失的单位是特殊群体,不具有与目标总体相同的期望与方差,那么对目标总体总值、均值的估计会产生偏差。;
偏差率为:
;;(二)包含异质单位的影响 ;如果是目标总体总值的估计,则其估计量偏差和偏差率分别为:
; 均值估计量方差会被高估或低估,总值估计量方差则一定是高估,即: ; 如果在调查中异质单位可以被识别并被予以剔除的,可以把目标总体看成抽样框中的一个子总体或域。异质单位的标志值就取0。;(三)复合联接的影响;;;;;(四)不正确辅助信息的影响;第三节 无回答误差分析; 一、无回答误差的成因 ;(二)无回答的成因;二、无回答误差的影响 ; 如果在调查中出现 个无回答、 个有回答( + = ),那么当总体无回答层与回答层之间无差异时,估计量方差就变为:
=
从而估计量方差增大的量为:
= = =
其中 = = 1- 为样本无回答率。
; 估计量方差增大的程度则为:
-1=
在这种情况下,为了达到抽样方案所规定的抽样估计效果,就需要增加样本容量。如果总体无回答率为 = ,那么样本容量应该确定为 = 。
; 如果令 = 为总体回答率, + =1,总体中回答层与无回答层的均值分别为 和 ,样本中回答层的均值为 ,那么当以 来估计总体均值 时,就会有偏差为:
E( )- = -
= -( + )
= ( - )
; 偏差率为:
=
其中 = 为回答层均值与无回答层均值之比。
不难发现, 越接近于1(即无回答率越高), 越远离于1(即回答层与无回答层之间的均值差异越大),那么估计量的偏差就会越大,偏差率就会越高,估计结果就越不准确、越不可信。; ; 所以当 时估计量方差高估,当 时低估。如果
, 那么当 =1时,必然会有 = ,
估计量方差低估或高估的现象也就自然会消除。可见,提高回答率是消除无回答影响的关键所在。
;三、无回答误差的控制;具体的调整方法技术有以下几种:
1.汉森与赫维茨(Hansen and Hurwitz,1946)方法。
2.复制估算法。
3.加权调整法。 ;1.汉森与赫维茨(Hansen and Hurwitz,1946)方法。;
文档评论(0)