- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(一)丢失单元抽样框的补救 (4)用复查结果调整。也就是采用核查和质量检查的方式,查明丢失单元的影响程度,并做为对原调查结果调整的依据。这种方法在我国的农产量调查中得到应用,在那里,抽样是依据上报面积进行,而在推算过程中是以核实面积调整上报面积(具体是用核实系数),又以丈量面积调整核实面积。 (二)其它类型不完善抽样框的补救 对于包含非目标总体单元的抽样框的补救,可以利用有关信息来进行调整,也可以通过对抽样框进行质量检查的方法以查明和剔除非目标总体单元。不准确的辅助信息常常是同抽样框资料的老化有关的。因此,在构造完善的抽样框时,必须注意选择最新的资料,同时要加强对抽样框的维护,以保证抽样框的质量。 (二)其它类型不完善抽样框的补救 对于抽样框中的复合联接问题,需要具体进行区分:对属于一对多联接(即一个抽样总体单元对应多个目标总体单元的联接)的情形,当这种现象比较多时,可以将其作为一种整群抽样,按整群抽样的方法处理;而对属于多对一联接(即多个抽样总体单元对应一个目标总标单元的联接)的情形,一是可以针对产生这种复合联接的原因重新定义联接规则,以使每个目标单元与抽样总体单元唯一联接。 (二)其它类型不完善抽样框的补救 如以职工名单为抽样框抽选职工家庭时,规定必须是家庭中年龄最大的职工方可入选样本,这样即使一个家庭有几个职工,但与只有一个职工的家庭被抽中的概率是相同的。二是利用有复合联接的调查数据,对目标总体进行估计,(具体方法可查阅有关文献,如J.T.莱斯勒等人的著作)。 (二)其它类型不完善抽样框的补救 使用多个抽样框 多个抽样框可能会产生重叠,对估计有影响,方法就是剔除重叠部分。 第三节 无回答误差 无回答误差比较普遍,对估计的影响也较大。根据产生条件不同,无回答可分为: 1、根据内容区分: 单元无回答:调查单元没有参与或拒绝接受调查。 项目无回答:某些问题没有回答,如敏感性、隐私性的问题。 无回答误差 2、按性质分: 有意无回答: 有意无回答对数据质量的影响很大,回答者与无回答者之间往往存在系统性差异,不仅减少了有效样本量,增大了估计量方差,而且导致估计偏倚。 无意无回答: 一般认为是随机的,但若产生于某个具有同样特征的群体时,也会造成估计的偏倚。(如旅游开支) 产生原因 1、查找阶段: 找不到被调查者 2、接触阶段: 找到但没有接受调查 3、采访阶段: 部分问题没有回答 无回答影响 对无回答进行研究时,可以把总体分为两层:第一层由入样能得到其计量值的所有单元组成,简称回答层;第二层由无法测得计量值的单元组成,简称无回答层。设N。N1,N2分别为总体单元数,回答层单元数和无回答层单元数,R1,R0分别为总体回答率和无回答率: 无回答影响 则总体均值: 从总体中抽取容量为n的简单随机样本,n1来自回答层,n0来自无回答层。可知回答单元样本均值 是总体回答层均值的无偏估计。 用 作为总体均值 的估计时,其偏倚为: 无回答影响 由此可得总体总量的偏倚和相对偏倚。 可以看出,导致无回答偏倚的原因主要来自两个方面: 回答层与无回答层之间的数量差异; 无回答率 启示: 如 ,这时相当于样本量的减少; 如 ,必须降低无回答率或加以调整。 降低无回答的措施 解决问题最好的方法是不让它发生。 1、问卷设计 2、激发被调查者的参与意识 3、确定准确的调查方位 4、消除疑虑 5、调查员的挑选 6、调查员培训 7、过程监控 8、奖励措施 9、再次调查(改变方法) 10、替换被调查者(按一定规则) 无回答数据的处理 (一)再抽样调整 指在第一次无回答单元中随机抽取一个子样本进行深入调查,作为无回答层的估计。 估计量见教材p261页 对无回答层单元进行再抽样,可以得到无偏估计量,但是以增大估计量方差为代价的。 无回答数据的处理 (二)加权调整 通过对调查中所获得的回答数据使用加权因子,来减小由于无回答造成的估计偏倚。 无回答数据的处理 (三)相关推估法 主要用于项目无回答 用已知信息估算未知信息的方法 无回答数据的处理 (四)插补调整 插补可以达到两个调整目的: 减小估计量偏倚 力图构造一个完整的数据集 实际中用的比较多的是均值插补: 将样本分成若干组 计算各分组均值替代缺失值 弱点: 1、歪曲了样本单元的分布;2、对方差的低估 第四节 计量误差 成因:设计误差、被调查者误差、调查者误差、其他误差。 (一)设计误差 用词不当 问题顺序 抽样过程设计(严格随机) (二)被调查者误差 无意识误差和有意识误差 第四节 计量误差 (三)调查者误差 记录错误 诱导 (四)其他误差 测量工具 编码 录入 计量误差模型 模型说明 如果存在计量偏倚,估计量有偏,且偏倚无法计算; 偏倚
文档评论(0)