- 1、本文档共83页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样调查-整群抽样培训课件(ppt 83页)
§4.1 整群抽样;二、群的划分; 群划分的一般原则
为了提高精度,划分群时应力争使同一群内各单元之间的差异尽可能大,以避免同一群内各单元提供重复信息.这个原则与分层抽样中划分层的原则恰好相反.由此看来,整群抽样和分层抽样是针对不同总体结构而提出的两种不同抽样方法.;三、群的规模;四、附号说明;总体中第i群的群总值:;总体中的个体均值:;总体群间方差:;总体中第i个群群内方差:;群规模相等时整群抽样样本群内方差:;§4.2 等概率整群抽样;一、群规模相等时的估计;定理4.1 是 的无偏估计,即;证明:因为 ;的样本估计为:;总体总值 ;【例4.11】 在一次对某中学在校生零花钱的调查
中,以宿舍作为群进行整群抽样,每个宿舍都有M=6
名学生。用简单随机抽样在全部N=315间宿舍中抽取
n=8间宿舍。全部48个学生上周每人的零花钱 及
相关计算数据如下表。试估计该学校学生平均每周
的零花钱 ,并给出其95%置信区间。;;解:已知
故;下面计算估计量方差的估计值:;2、整群抽样效率分析 ;群规模相等时的整群抽样
总体方差分析表; 我们将整群抽样与简单随机抽样的效率进行比较,假设直接从总体中抽取一个样本容量为nM的简单随机样本,则样本均值的方差为: ;根据组合及平均值的计算, 又可表示为:;事实上,前面提到的 可以用群内相关系数
近似表示:;若采用简单随机抽样,直接从总体中抽取;整群抽样估计效应与群内相关系数 关系密切,;若群内方差大于总体方差时,ρ的取值为负,; 另外,群内相关系数 也可以用群内方差
和群间方差 表示,并由样本统计量
估计:;【例 4.2】 估计例4.1中以宿舍为群的群内相关系数
与设计效应.;由相关系数的估计式有;采用整群抽样,如果各群规模;因为群规模不等,估计时又未考虑权数,所以;2、等概抽样,加权估计; 如果总体群平均规模 未知,可以用样本群;它的无偏估计为:;3、等概抽样,比率估计;根据比率估计量的方差公式,估计量 ;的样本估计为:;4、例题和方法比较;样本乡编号;(1)无偏估计(等概抽样,简单估计);(2)无偏估计(等概抽样,加权估计);(3)以群规模为辅助变量的比率估计;(4)种植面积为辅助变量的比率估计;【补充】 总体比例的估计;为样本中第 i群具有某特征单元数的比例;;二、群规模不等的估计;的估计式为:;【例6.5】某居民小区有415个居民小组,现采用整群
等概抽样,随机抽取25个小组为样本,调查中的一项内
容为估计男、女性别比例,下表资料为样本中女性的分
布。试用95%的置信度估计该小区女性比例的致信区间,
并用简单随机抽样方法进行比较。;群(i);解:这是群规模不等的比例估计
总体比例的估计为:;故置信区间为:;于是可以计算设计效应;§4.3 等概率两阶段抽样;多阶段抽样的优点; 二、抽样方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也可以不同。它通常与分层抽样、整群抽样、系统抽样结合使用。多阶段抽样时,抽样是分步进行的,因此,讨论估计量的均值及其方差时,需要分阶段进行,这要用到下面的性质。; 对于两阶段抽样,有; 上述性质可以推广到多阶段抽样的情形,例如
对于三阶段抽样,有;三、等概率两阶段抽样的符号说明;第一阶段和第二阶段的抽样比:;初级单元内的方差:;四、初级单元大小相等的二阶抽样;编号; 表中红字为抽中的房号 .
在这里,初级单元(楼盘)有15个,每个初级单元拥有二级单元(居民户)12个。首先将初级单元从1到15编号,在15初级单元中随机抽取5个单元,分别是1,6,9,12,13号;然后在被抽中的初级单元中,进行第二次抽样,即分别在抽取的5个楼盘中随机抽取4户。这就是初级单元规模相等的两阶段抽样。;规模相等两阶段抽样的估计量及其性质;总体均值估计量方差为:;【例4.4】欲调查4月份100家企业的某项指标,首先
从100家企业中抽取了一个有板有5家样本企业的简单随
机样本,调查人员对5家企业分别在调查月内随机抽取3
天作为调查日,要求样本企业只填写这3天的流水帐。
调查的结果如下。;解 将企业作为初级单元,将每一天看着二级单元。
调查月内拥有30天(即拥有30个二级单元)。;样 本 企 业; 置信度为95%的置信区间为:160800±1.96×9216
在上面的方差估计式中,第一项是主要的,第二项
要小得多!;五、初级单元规模不等的二阶抽样;第一阶和第二阶的抽样比:;按二级单元的平均值:; 对初级单元进行简单随机抽样;的一个无偏估计
文档评论(0)