辅助信息下的逆抽样设计算法.pdfVIP

下载本文档

6
0
约1.03万字
约 8页
2018-01-21 发布于北京
举报

辅助信息下的逆抽样设计算法.pdf

第40卷第3期数学的实践与认识 Vbl．40．No．3 IN Fbb．．2010 2010年2月 MATHEMATICSPRACTICEANDTHEORY 辅助信息下的逆抽样设计算法谢佳斌·，金勇进2 (1．中国人民大学统计学院，北京100872) (2．中国人民大学应用统计科学研究中心，北京100872) 摘要：通过将逆抽样设计视为一种特殊的二重抽样，建立了二重抽样和为回归估计的二重抽样的一般形式，得到了逆抽样设计算法下的回归估计．模拟分析的结果表明，以回归估计的形式引入较为合适的辅助信息，能够在估计精度上对逆抽样设计算法做出改进．关键词：辅助信息；逆抽样设计；二重抽样；回归估计； 0问题的提出一些经典的统计分析方法，如回归分析、卡方检验等，通常要求数据满足独立同分布等假定，但当数据来自于一个复杂调查时，存在的分层、整群等抽样效应将使得数据结构不再满足这些假定，因而需要采用一些改进措施．归纳起来，目前的做法普遍的思想都是对方法进行调整以适应数据的复杂结构．出了基于这一思想的逆抽样设计算法，其主要思想是通过选择一个抽样机制，对调查得到的初始样本进行二次抽样，二次抽样机制的设计消除了初始样本中的复杂结构，使得按照该抽样机制抽选出来的子样本符合简单随机样本结构．随后，再基于这些具有简单随机样本结构的子样本构造估计量．如果用一句话来概括，那就是通过选择一个二次抽样机制，使得两次抽样的联合相当于一次简单随机抽样．图1为该算法的流程示意图：图1逆抽样设计算法的流程示意图然而，通常按照这样的逆抽样设计，抽得的子样本的样本量相比初始样本要小．为了尽可能地减少由二次抽样带来的信息损失，需要独立地重复抽取多个这样的子样本，并且对于某些情形，子样本的抽取数量非常大，这增加了算法执行的复杂性．而如果能在估计阶段采用一些方法提高基于单个子样本的估计精度；则可以相应地减少子样本的抽取数量，降低算法执行的复杂程度，基于这一设想，本文研究在估计阶段通过引入辅助信息以提高估计精度，进而对算法做出改进．收稿日期：2009—10—15 资助项目：国家自然科学基金“我国统计数据质量的评估系统研究” 3期谢佳斌，等：辅助信息下的逆抽样设计算法 139 l逆抽样设计算法下的估计得到的总体参数估计和该估计量的方差估计，则基于全部1个逆样本，p的估计可构造为[2】：舀B=i1∑岛 (1) b的方差为 (2) var(站)=var(百i)～等E[Var(‰)] 珏的方差估计为％：去∑B矿卜击∑B(岛一幻)2％2去∑矿卜击∑(让幻)“ (3’(3) ’Z=1 1=1 若彰和矿，f无偏，则站和％同样也是无偏的． 2引人辅助信息的基本构想对于任何调查而言，引入辅助信息的形式可以有两种：一种是辅助信息事先未知，需要通过调查获得；另一种情形是辅助信息事先是已知的，比如调查指标的前期资料、近期的普查资料等．对于第一种情形，此时恰好可以将逆抽样设计算法中抽取单个子样本的过程看成是一种特殊的二重抽样：数为n；观测辅助变量信息，得到辅助变量的估计．元数为n7；对于第二重样本，观测目标变量与辅助变量，并根据目标变量与辅助变量之间的关系，用获得的观测值构造比率、乘积、回归或差值估计．不是通常的简单随机抽样，而是可以视为不放回的、与第一重样

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

辅助信息下的逆抽样设计算法.pdfVIP