调查中的非抽样误差.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1页,共41页,星期日,2025年,2月5日本章结构11.1引言11.2抽样框误差11.3无回答误差(补充敏感问题调查)11.4计量误差11.5离群值的检测和处理第2页,共41页,星期日,2025年,2月5日学习目标理解调查中的误差来源掌握抽样框误差的类型及不完善抽样框的使用掌握无回答误差的来源、影响及弥补措施掌握敏感性问题调查模型了解计量误差的来源第3页,共41页,星期日,2025年,2月5日11.1引言一、概念抽样误差(samplingerror)是由于样本的随机性引起的样本统计量的数值与总体目标量真值之间的差异。它随着样本容量的增大而减小。非抽样误差(non-samplingerror)是指除了抽样误差之外,由于其他各种原因而引起的误差,是所有调查都可能存在的误差。第4页,共41页,星期日,2025年,2月5日非抽样误差的特点1、具有普遍性,由于它不是由于样本的随机性带来的,因而它不随样本容量的增大而减小;2、非抽样误差的存在往往造成估计量的有偏(如:无回答);3、具有隐蔽性,难以识别或测定;4、产生原因复杂。第5页,共41页,星期日,2025年,2月5日非抽样误差的产生1、可能在调查及抽样设计阶段产生,如:问卷设计不合理造成词义含糊;抽样设计中抽样框不完善(这是一个重要原因);抽样设计中使用了不准确的辅助信息等等;2、可能在数据采集阶段产生,如:无法找到被调查者或被调查者不在家或者不愿意接受调查(无回答是数据收集阶段产生非抽样误差的主要原因);3、可能产生在数据处理与分析阶段,如:对数据的审核、整理、编码及录入引起误差。第6页,共41页,星期日,2025年,2月5日非抽样误差的分类按照来源、性质分三类:(1)抽样框误差——抽样框不完善;(2)无回答误差——没有从调查单元获得调查结果,造成数据的缺失;(3)计量误差——所获得的数据与其真值之间不一致。第7页,共41页,星期日,2025年,2月5日11.2抽样框误差一、概念:1、抽样框是有关总体全部单元的名录或地图等的框架,是抽取样本单元的依据。2、理想的抽样框(也称抽样总体)应该同所研究现象的总体(也即目标总体)一致,但在实践中,抽样总体与目标总体常常不一致,由此产生的误差就是抽样框误差。3、现实中完善的抽样框往往难以得到第8页,共41页,星期日,2025年,2月5日二、抽样框误差的类型及影响(一)类型1、丢失目标总体单元(少或漏),这种误差不易被察觉,可能造成总量估计偏低,均值估计有偏;2、包含非目标总体单元(多),容易造成总量估计偏高,但比较容易察觉;3、复合连接(重复),指抽样框中的单元与目标总体单元不完全一一对应,一个抽样框单元与多个目标单元连接或一个目标单元与多个抽样框单元连接,如:入户调查中常出现的一门多户或一户多个住处等等;4、不正确的辅助信息,有些抽样如分层臭氧、比率估计和回归估计等等需要辅助信息,若信息不完全或不正确就会影响抽样效果。第9页,共41页,星期日,2025年,2月5日(二)对抽样框的一些基本认识1、建立抽样框事先要做好充分的研究和资料搜集2、抽样框的维护、使用需要不断总结与研讨3、有些不完善的抽样框还可以使用,但是需要一定的财力、人力来修补、调整;4、抽样框误差有时会被解释成其他形式的误差第10页,共41页,星期日,2025年,2月5日(三)抽样框误差的影响只对丢失目标总体单元的抽样框引起的误差进行分析:1、对总体总和的估计(1)总体总和的真值(2)总体总和的样本估计值(3)偏倚(4)相对偏倚第11页,共41页,星期日,2025年,2月5日分析1、总体总和和估计的相对偏倚取决于r和W0两个因素。2、r=1即丢失单元均值与抽样框单元均值相等时,相对偏倚为-W03、r1,相对偏倚的绝对值也小于W0的绝对值。第12页,共41页,星期日,2025年,2月5日2、对均值估计的影响(1)在抽样框存在丢失单元时,均值的估计为:(2)估计量的偏倚为:(3)相对偏倚为:第13页,共41页,星期日,2025年,2月5日分析1、r=1,丢失单元均值和抽样单元均值相同时,估计量是目标变量的无偏估计;2、偏倚状况随着r的变化而变化。r1估计偏低,r1估计偏高。第14页,共41页,星期日,2025年,2月5日三、不完善抽样框的使用(一)实行连接在调查方案设计阶段制定一定的规则,使没有包含在抽样框中的目标单元与包含在抽样框中的单元相连接。如:对不在抽样框中的学生与被抽中的学生实行连接(二)惟一连接对于抽样框中存在的复合连接,在方案设计中规

您可能关注的文档

文档评论(0)

xiaoyao2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档