辅助信息下的逆抽样设计算法.pdfVIP

  • 6
  • 0
  • 约1.03万字
  • 约 8页
  • 2018-01-21 发布于北京
  • 举报
第40卷第3期 数学的实践与认识 Vbl.40.No.3 IN Fbb..2010 2010年2月 MATHEMATICSPRACTICEANDTHEORY 辅助信息下的逆抽样设计算法 谢佳斌·,金勇进2 (1.中国人民大学统计学院,北京100872) (2.中国人民大学应用统计科学研究中心,北京100872) 摘要:通过将逆抽样设计视为一种特殊的二重抽样,建立了二重抽样和为回归估 计的二重抽样的一般形式,得到了逆抽样设计算法下的回归估计.模拟分析的结果 表明,以回归估计的形式引入较为合适的辅助信息,能够在估计精度上对逆抽样设 计算法做出改进. 关键词:辅助信息;逆抽样设计;二重抽样;回归估计; 0问题的提出 一些经典的统计分析方法,如回归分析、卡方检验等,通常要求数据满足独立同分布等 假定,但当数据来自于一个复杂调查时,存在的分层、整群等抽样效应将使得数据结构不再 满足这些假定,因而需要采用一些改进措施.归纳起来,目前的做法普遍的思想都是对方法进 行调整以适应数据的复杂结构. 出了基于这一思想的逆抽样设计算法,其主要思想是通过选择一个抽样机制,对调查得到的 初始样本进行二次抽样,二次抽样机制的设计消除了初始样本中的复杂结构,使得按照该抽 样机制抽选出来的子样本符合简单随机样本结构.随后,再基于这些具有简单随机样本结构 的子样本构造估计量.如果用一句话来概括,那就是通过选择一个二次抽样机制,使得两次抽 样的联合相当于一次简单随机抽样.图1为该算法的流程示意图: 图1逆抽样设计算法的流程示意图 然而,通常按照这样的逆抽样设计,抽得的子样本的样本量相比初始样本要小.为了尽可 能地减少由二次抽样带来的信息损失,需要独立地重复抽取多个这样的子样本,并且对于某 些情形,子样本的抽取数量非常大,这增加了算法执行的复杂性.而如果能在估计阶段采用一 些方法提高基于单个子样本的估计精度;则可以相应地减少子样本的抽取数量,降低算法执 行的复杂程度,基于这一设想,本文研究在估计阶段通过引入辅助信息以提高估计精度,进而 对算法做出改进. 收稿日期:2009—10—15 资助项目:国家自然科学基金“我国统计数据质量的评估系统研究” 3期 谢佳斌,等:辅助信息下的逆抽样设计算法 139 l逆抽样设计算法下的估计 得到的总体参数估计和该估计量的方差估计,则基于全部1个逆样本,p的估计可构造为[2】: 舀B=i1∑岛 (1) b的方差为 (2) var(站)=var(百i)~等E[Var(‰)] 珏的方差估计为 %:去∑B矿卜击∑B(岛一幻)2%2去∑矿卜击∑(让幻)“ (3’(3) ’Z=1 1=1 若彰和矿,f无偏,则站和%同样也是无偏的. 2引人辅助信息的基本构想 对于任何调查而言,引入辅助信息的形式可以有两种:一种是辅助信息事先未知,需要通 过调查获得;另一种情形是辅助信息事先是已知的,比如调查指标的前期资料、近期的普查 资料等. 对于第一种情形,此时恰好可以将逆抽样设计算法中抽取单个子样本的过程看成是一种 特殊的二重抽样: 数为n;观测辅助变量信息,得到辅助变量的估计. 元数为n7;对于第二重样本,观测目标变量与辅助变量,并根据目标变量与辅助变量之间的关 系,用获得的观测值构造比率、乘积、回归或差值估计. 不是通常的简单随机抽样,而是可以视为不放回的、与第一重样

文档评论(0)

1亿VIP精品文档

相关文档