关键词抽样误差非抽样误差抽样框误差无回答误差随机化指导.ppt

下载文档 降价啦

46
0
约6.95千字
约 45页
2017-03-20 发布于湖北
举报
版权申诉
保障服务

关键词抽样误差非抽样误差抽样框误差无回答误差随机化指导.ppt

1、本文档共45页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第十一章非抽样误差关键词：抽样误差非抽样误差抽样框误差无回答误差随机化回答计量误差 §11.1 非抽样误差的主要来源与分类非抽样误差可产生于抽样调查的各个环节，常见的产生原因有以下几点：上述非抽样误差按其来源，性质和处理方法不同，分成以下三类： §11.2 抽样框误差抽样框误差包括以下几方面： §11.3 无回答误差例11.1：某学校调查学生每月看电影的次数，随机抽取了n=1000人进行问卷调查，其中n1=800 人作了回答，结果是平均每月看电影2.5次。估计全校学生平均每月看电影的次数的偏倚。若对无回答的200人又随机抽取了50人进行面访，结果他们平均每月看电影1.2次，求偏倚的估计。例11.2：某项民意测验，样本量为n=1000人，其中人作了回答，根据回答的统计，反对人数比例为20％，用两种方法求总体比例P估计的 95％的置信区间。二.降低无回答的措施与处理方法例11.3：在一次服装消费行为调查中，上海市的样本量为1000户，第一次访问得到345份答卷；对没有答复的样本单元进行第二次访问，得到163份答卷；更换调查员后对还没有回答的对象进行第三次访问，又得到50份答卷。对每次访问，分别计算被调查户人均月收入指标结果如下表。例11.4：欲进行一次民意测验，假定总体比较大，如果没有无回答，按精度要求抽取1000人（简单随机样本）。现拟先采用费用较低的邮寄问卷调查，预期无回答率为 40％，然后对所有无回答的再抽一个简单随机子样本进行派员访问。设邮寄一张问卷的费用是1.0元，对回答的每份问卷数据处理费用是1.2元，派人调查与数据处理费用合计每份13.5元。假定无回答层方差与总体方差相等，试求为满足精度要求应邮寄多少份？对无回答者进行派员调查的比例是多少？预期总的费用多少？ §11.4 敏感性问题调查与随机化回答技术敏感性问题按指标特征可分为属性特征问题和数量特征问题例11.6：某大学为正确估计本校学生在考试中曾发生过舞弊行为的比例，随机抽取n个学生进行调查，对每个学生显示两个问题：问题A：你在考试中曾作过弊，对吗？问题B：你在考试中不曾作过弊，对吗？另外交给学生一个密闭的容器，其中装有红白两色的球，红球与白球之比为P：(1-P)。令被调查的学生随机摸一球，若抽到红球如实回答问题A，若抽到白球如实回答问题B，由于答案只有“是”或 “否”，且别人又不知道回答的是哪个问题，因此学生可毫无顾虑地给出符合实际情况的答案。设n个被调查者中共有m个回答“是”，我们来推导在考试中曾发生过舞弊行为的比例。三. 西蒙斯随机化回答模型例11.7：仍以调查考试作弊现象为例，问题A不变，问题B换成：你是五月份出生的吗？设n个被调查者中共有m个回答“是”，我们来推导在考试中曾发生过舞弊行为的比例。例11.8：某社会学研究所欲调查已婚男子瞒着妻子存私房钱情况。利用西蒙斯模型，对随机抽出的 N=800个已婚男子进行调查，设计的两个问题是：问题A：你是否存私房钱？问题B：你的阳历生日日期是不是奇数？随机化装置的P=1/2，在800人中共有m=420人的回答为“是”,试估计已婚男子存私房钱的比例并给出 90％置信区间。三. 对无回答的调整 1. 二重抽样法 2. 加权调整法加权调整法是通过给每个回答数据赋以不同的权数，然后再进行数据处理，以此来调整由于无回答引起的偏差。例如，在一项以导游为对象的问卷调查中，出现了无回答。经分析，发现大旅行社的导游回答率低于小旅行社。如果不经过调整，由于回答样本数据中大旅行社导游的比例低于小旅行社的相应比例，因而必然引起偏差。为了纠正偏差，在数据处理时对回答数据中，凡是属于大旅行社的赋以较大权数，而对属于小旅行社的赋以较小权数，这就是加权调整。 3. 估算法估算法是指当无回答出现时，用适当的方式对每个缺失的无回答数据进行估计或直接用别的现有数据替代。这种方法常用在项目无回答情形，即被调查者接受了调查，但对个别项目则可能有意无意地没有回答。通过对这些被调查者其他资料分析结合该项目已回答数据，可用现有回答数据平均数、众数，或用回归估计估算无回答的缺失项目。有时候还可用与无回答单元其他特征基本类似的单元的数据直接替代。例11.5：一项对个人的收入与私人汽车拥有情况调查，同时记录了被调查者的性别，年龄与婚姻状况。数据如下。－有无－有－－ 45 － 20 50 －已婚离异未婚