- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10章 抽样估计与样本量确定 引言 估计就是根据从样本中收集的信息对总体未知量进行推断的过程。 抽样估计涉及的重要问题: 样本单元的设计权数问题。 抽样估计,包括总体总量、均值和比例以及抽样误差的估计。 样本量的确定构成抽样设计程序的重要步骤和内容。同时,样本量的确定与样本估计值的精度密不可分。 10.2 加权及权数调整 设计权数 设计权数是指每个样本单元所代表的调查总体的单元数,它是由抽样设计所决定的,通常以wd表示。 设计权数其实就是样本单元的入样概率的倒数。假如入样概率是1/10,那么设计权数即为10。 加权估计 确定设计权数是估计的第一步。 根据样本单元的入样概率是否相等,抽样方式可分为等概率抽样和不等概率抽样两类。因此,加权估计应区分等概率抽样和不等概率抽样两种情况讨论。 等概率抽样的加权估计 当每个单元都有相同的入样概率时,设计权数相同。此时,如果无需处理无回答问题(涉及权数调整),则计算比例、均值等估计量时可将其忽略,对总值估计仅需将样本总值乘上设计权数。这类抽样就是自加权设计。 不等概率抽样的加权 自加权设计并不总是可行。如,在某个全国性调查中采用纽曼分层,对较小地区抽取一个较按比例分配方法更大的样本量,或者对较大地区抽取一个更小的样本量。这就是不等概率抽样设计。 不等概率抽样的加权估计,必须区分不同层/群不同的设计权数,分别估计。(如何估计,未完,补充例子!) [例10.2] 有关各层总体数和样本数资料见表10-1。对于这项调查,被调查者的设计权数是多少呢? 设计权数的调整 上述等概率抽样的加权和不等概率抽样的加权都是加权的基本形式。 权数估计常会遇到更复杂情况: 考虑无回答的情况,然后对权数做出调整; 借助某些辅助信息,对权数做出调整。 对无回答的权数调整 单元无回答是指一个样本单元的所有数据都缺失。简单处理办法是忽略它。然而,如果发现忽略单元无回答是不适当的,则应该对权数进行调整。即, 设计权数×无回答调整因子=无回答的调整权数 对于自加权设计,无回答调整因子用原样本的单元数与给出回答的单元数的比值来表示。 无回答权数调整应区分两种不同情况: 等概率抽样 不等概率抽样 对无回答的权数调整(SRS) [例10.3] 从一个N=100人的总体中抽取一个n=25人的简单随机样本。记回答单元的数量为nr,结果显示只有20个人提供了所需的信息。那么,此时无回答的调整权数是多少? 对无回答的权数调整(STR) [例10.4] 对于一项公共交通系统调查,总体由1100人组成,并按城乡分为两个层。分层及样本数据如表10-2所示。那么,回答者的权数是多少? 使用辅助信息调整权数 为什么要使用辅助信息来调整权数呢? 一是使调查的估计值与已知总体总值相匹配。例如,使用最新的人口普查数据来调整估计值,以确保这些估计值(如年龄、性别分布等)的一致性。 二是为了提高估计值的精度。将辅助信息与抽样设计相结合,将有助于提高估计的精度。 要想在调查设计阶段使用辅助信息,抽样框中的所有单元都必须具备这个辅助信息。否则,就只能在数据收集上来后,在估计阶段利用辅助信息提高估计值的精度。 使用辅助信息调整权数 [例10.5] 为得到某公司职员吸烟习惯的信息,进行了一项调查。从N=780人的名录中抽出了一个n=100人的简单随机样本。 100人都做出了回答,由此得到样本数据的分布如表10-3所示: 10.3 抽样分布与抽样误差 抽样调查的目的是要对总体做出推断。 了解统计推断的理论基础,首先注意区分三种不同性质的分布: 总体分布 样本分布 抽样分布 特别注意总体分布与抽样分布的关系。 三种不同性质的分布 总体分布:总体各单位的观察值所形成的频数分布,总体分布通常是未知的。 样本分布:一个样本中各个观察值所形成的频数分布。当样本容量n逐渐增大时,样本分布接近总体分布。 抽样分布:样本统计量的抽样分布,是指在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布。抽样分布是一种理论分布。 抽样分布提供了样本统计量长远而稳定的信息,是进行推断的理论基础。 样本均值的抽样分布 样本均值的抽样分布,是指在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布。 下面通过[例10.6]来了解一个总体的分布及其样本均值的抽样分布。 均值抽样分布的规律 比例抽样分布的规律 样本比例的抽样分布,是在重复抽取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布。 比较样本比例的分布与总体分布,得出如下结论: 当样本容量足够大时,样本比例的抽样分布近似地服从正态分布,样本比例的数学期望等于总体比例,即E(p)=π;在重复抽样条件下,样本比例的方差为总体方差的1/n,即 样本比例的中心极限
您可能关注的文档
最近下载
- (正式版)D-L∕T 860.74-2014 电力自动化通信网络和系统 第7-4部分:基本通信结构 兼容逻辑节点类和数据类.docx VIP
- 钢格栅板及配套件国家标准.pdf
- 防火墙运维.docx VIP
- T_BPMA 0010—2021_现制现售净水机卫生管理规范.pdf VIP
- 有害物质识别与评估控制程序.doc VIP
- 胃脘痛•胃痞病(胃息肉)中医临床路径标准住院表单.docx VIP
- JAVA应用系统开发规范概要1.doc VIP
- 临床诊疗指南(肿瘤科分册).doc
- 剑桥少儿英语一级上unit15_a_happy_new_year.ppt VIP
- 2024年05月广东惠州市生态环境局博罗分局和博罗县污染防治攻坚战总指挥部办公室公开招聘编外人员笔试历年典型题及考点剖析附带答案含详解.docx VIP
文档评论(0)