样本结构性偏差的校准加权调整方法.pdf

样本结构性偏差的校准加权调整方法.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
样本结构性偏差的校准加权调整方法 金勇进1,薛芳1,侯志强2 (1.中国人民大学统计学院,北京100872;2.北方工业大学,北京100041) 摘要:校准估计是基于事后分层的加权调整估计,用于解决大规模调查中调查样本与总体存在 结构性偏差的问题。本文系统总结了校准估计的方法,特点,以及校准估计与事后分层,广义回归估计 的关系。 关键词:校准估计;事后分层;广义回归估计 中图分类号:021 文献标识码:A 文章编号:1002—6487{2007)05—0008-03 在抽样调查中,样本结构与总体结构产生偏差的原因很 助信息进行事后分层,并利用辅助变量构造一个示性向量表 多。主要有以下方面:一是调查前不能进行或来不及事先分 示单元所属类别。辅助信息可以来自行政管理数据、普查或 层,使得在影响目标量的主要辅助变量上,调查后样本结构 其他调查,并要求辅助变量的总体总量已知。事后分层可表 与总体结构存在偏差;二是进行分层多阶段抽样设计时,划 示成列联表形式。为简单起见,下面以辅助信息为两个分类 分总体的分类指标很多,但由于条件的限制,往往不能完全 变量为例,构造列联表进行讨论。其结果可以推广到多个辅 考虑这些分类指标;比如分层考虑了最主要的指标地区、城 助变量的情形。考虑有N个单元的有限总体u,假定该总体 乡,没有考虑同样与调查目标量高度相关的年龄、文化程度 被两个辅助变量交叉分为rxc类,如5个年龄组和11个职业 等因素。三是大规模的调查涉及调查单位和人员广泛,层层 组的交叉分类数为5xl1=55。U。S。分别表示落入第(i,j)个格 监督和控制难度加大;四是大规模抽样调查后期对大量数据 子内的总体和样本,N。n。分别表示落入第(ij)个格子内的总 的处理会对样本结构产生影响。如调查中无回答产生的问卷 体单元和样本单元数目,即格子总计(cellcounts)。N=∑:=,∑ 失效率较高,剔除失效问卷往往会产生结构性偏差。 ::。Ni,n=∑::,∑:。ni,Ni,N。n。n.,分别表示总体和样本的边际 若在与调查目标量高度相关的指标上,调查的样本结构 总计(marginal 与总体结构有较大的偏差,直接利用调查样本的初始权数进 Counts)。其中Ni.=∑:1NijNJ=∑::lNijnj=∑:l 行估计势必影响目标估计量的估计精度。在这种情况下,要 想较为准确地推断出总体的有关信息,提高估计的精度,就 的总体总值和样本总值,Yij=Y,|kEU yij=∑ Yk 必须对调查的样本结构进行加权调整。校准加权调整是利用 kY,。比。 已知调查总体的辅助信息,在满足一定的约束条件下,对样 对于调查的样本,事后分层后格子总计和边际总计容易 本进行加权调整,使得加权后的样本结构尽可能的与总体结 确定,但总体的格子总计和边际总计的确定依赖于所获取的 辅助信息翔实与否。利用辅助信息对总体进行事后分层后, 构尽可能的一致,减小样本结构与总体结构的差异性,从而 达到减小抽样方差和偏差,提高估计精度的目的。本文将系 根据格子总计和边际总计是否已知可以把校准估计分为两 统阐述校准估计的方法,特点。以及校准估计与广义搜寻比 种情形。一是总体的格子总计和边际总计已知的情形,称为 率估计,事后分层估计,广义回归估计的关系。 完全事后分层的校准估计。二是仅知道边际总计,而格子总 计未知的情形,称为不完全事后分层的校准估计。基于不完 1 基于事后分层的校准加权调整方法

您可能关注的文档

文档评论(0)

sunache + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档