抽样技术-第8章.pptx

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第8章 调查中的复杂样本8. 1 调查中的辅助信息目标变量之外的其他变量为改进估计而专门设计的变量内部辅助信息访问员反馈信息8.1.1 辅助信息的种类: 普查资料前期调查资料外部辅助信息各级政府部门的统计数据各企事业单位的工作记录8.1.2 辅助信息的利用抽样设计:如分层抽样中层与层之间的分界点,不等概抽样中每个单位被抽中的概率与其规模有关,系统抽样中采用的“按有关标志排队”的方法。估计:比率估计和回归估计中的“x”。数据调整:对入样单元进行权数的计算和调整;利用辅助信息减小调查中无回答的偏差。8.2 设计效应?一个特定的抽样设计估计量的方差对相同样本量下无放回简单随机抽样的估计量的方差之比,即总体均值估计量的设计效应:8.2.2 设计效应的应用对复杂样本的抽样设计效率进行比较 设计效应值越大,说明该复杂抽样设计误差大、精度低,效率也越低。通常来说,分层抽样的设计效应小于1,而整群抽样的设计效应大于1。 ?计算复杂抽样所需要的样本量 记所需的样本量,若可估算出复杂抽样的设计效应,则复杂抽样所需的样本量近似为:?常见抽样方式设计效应的估计分层随机抽样的设计效应 其中,整群抽样的设计效应(以群规模相等为例)为群内相关系数,取值范围。?系统抽样的设计效应 其中,为同一系统样本内单元的相关系数,取值范围为.目标变量与辅助变量呈线性关系的pps抽样的设计效应 8.3.1 设计权数 由抽样设计所规定的每个样本单元所代表研究总体的单元数,也就是样本单元入样概率的倒数。等概率抽样:每个单元的设计权数是相同的不等概率抽样:每个单元的设计权数不同在多阶段抽样:设计权数由每个单元在不同阶段的入样概率相乘而得?8.3.2 权数的结构调整 主要指调查现场出现与抽样设计不同情况,为了保证抽样设计方案的落实,而进行的某些权数调整。 以整群抽样为例,记n为抽样设计的群规模,模,则该群中每个样本单元的结构调整系数.?8.3.3 权数的无回答调整 令为无回答调整系数, 为调查中回答单元的权数和, 为调查中无回答单元的权数和,则调整的思路就是把无回答单元的设计权数在回答单元之间进行重新分配。?8.3.4 最终权数 对目标量进行估计所使用的权数,是设计权数、结构调整系数、无回答调整系数的结合体。 最终权数=8.3.5 自加权设计 调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。 在单阶段抽样条件下进行自加权设计比较容易,如简单随机抽样、系统抽样、按层规模等比例分配样本的分层抽样等都属于自加权设计。下面以PPS抽样、分层抽样、多阶段抽样等几种不同抽样方法的组合,对自加权设计进行讨论:?分层PPS抽样 对总体进行分层,然后在各层采用PPS抽样。 若将总体划分为L层,为第h层中第i个样本单元的调查值,为第h层中第i个单元的规模,为第h层的总规模。由抽样理论,该方法总体总值估计量为?如果是自加权设计,则要求低h层的样本量为,也就是各层样本量与层规模大小成比例,于是上式可简化为:?2. 两阶段抽样 两阶段抽样的总体总值的估计量为:要使这种抽样方式成为自加权设计,就必须使成为常数,即在第二阶段的抽样中,都采用等比例抽样。?3.两阶段PPS抽样如果第一阶段采用与初几单元规模成比例的概率抽样,第二阶段采用等概率方法,则总体总值的估计量为 总结如下:对a阶段抽样,要实现自加权设计,可以在前a-1阶段采用PPS抽取前a-1级样本单元,在入选的第a-1级单元中采用等概率方法抽取相同数量的最终单元。8.4 复杂样本的数据分析?有无电脑男性家长学历?有无合计本科及以科以下398160558合计5001906908.4.1 复杂样本的列联表分析1. 列联表分析的群效应例1.关于家庭是否拥有电脑的调查 调查男性家长学历时的观测频数表?在家庭是否拥有电脑与男性家长学历相互独立的假设下计算期望频数,可得到卡方统计量:P值为0.169,没有充分理由拒绝原假设,认为家庭拥有电脑与男性家长的学历相互独立。?有无电脑每一位家长的学历?有无合计本科及以科以下8103261136合计10003801380现在假设对抽中的每个家庭,同时询问夫妇双方的学历及家中是否有电脑,调查结果如下表:?同样进行卡方检验,得到,p值为0.037.可以在0.05的显著性水平下拒绝原假设,即认为家庭拥有电脑与家长学历有关。为什么会出现这样的矛盾?经分析发现,夫妇双方的学历具有较强的相关性,但他们的回答是一样的,这导致各个观测值并不相互独立,违背了卡方检验的假设,这就是复杂样本的群效应。2.考虑观测值权数的列联表分析例2. 设某地有100000户家庭,其中完整家庭有99000户,不完整(离异)家庭有1000户,采用放回简单随机抽

文档评论(0)

BLUED + 关注
实名认证
内容提供者

教师资格证持证人

全网 内容最全课件 价格最低 质量最高 不是之一,是唯一。 每个人使用的办公软件版本不一样,如有个别显示不出的文件,建议使用最新版。

版权声明书
用户编号:8070063100000015
领域认证该用户于2023年03月20日上传了教师资格证

1亿VIP精品文档

相关文档