- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 分层随机抽样
在前面一章,我们介绍了简单随机抽样。应该说简单随机抽样在实际中具有广泛的应用,尤其是在总体N较小或者总体方差与任意局部方差基本相当的情况下,简单随机抽样的优势明显。然而,当总体单元数N较大或者总体各单元之间差异较大时,采用简单随机抽样对总体指标进行估计通常会产生很大的误差。例如,欲通过调查了解我国居民的人均年收入水平。这时总体是全国人口的13亿人,倘若采取简单随机抽样从中抽取10万人入样,则需要将全国人口依次编号,然后在1~13亿中生产10万个随机数,然后将这些随机数一一对应成具体某个人。显然这样做是不实际的,就算可以,由于某些人口较少的省市或民族的样本量过小,甚至没有样本点,从而降低了样本对总体的代表性。不仅如此,由于类似的全国性调查总是需要地方政府的大力协调与配合,如果地方政府不能通过此次调查获取辖区内的相关信息,达到一举两得的效果,那就勉为其难了。为了克服简单随机抽样上述缺陷和不足,本章引入——分层随机抽样(Stratified sampling)。
§3.1 定义与符号
一、定义与符号
(一)定义
定义3.1 层(类):如果一个包含N个基本单元的总体可以分成“不重不漏”的L个子总体,即每个单元必属于且只属于其中一个子总体,则称这样的子总体为层(stratum)。设L个子总体所包含的单元数分别为,即有:
,,
定义3.2 分层抽样 又称为类型抽样或分类抽样,即抽样在每个层中独立进行,总的样本由各层样本构成。
定义3.3 分层随机抽样
若在每层中的抽样采用SRS,这样得到的样本为分层随机样本(stratified random sample)。即从第层简单随机抽样个单元,构成第层子样本。
,,
(二) 分层的原因
(1)当总体各单元差异比较大时,对参数估计误差比较大。将总体分层,同一层中各单位差异小,从每一层中抽取构成样本,这样样本就有代表性,可以提高估计的精度;
(2)可以同时对子总体进行参数估计;
(3)便于依托各级管理机构进行组织和实施。
(层内类似,层间差异)
(三)符号说明
用下标表示层号()。关于第层子总体的记号如下
单元总数: , 样本单元数:,第个单元标志值(观察值):,
层权: ,抽样比
子总体均值:,子样本均值:,
子总体总量:,子样本总量: (注意此说法)
子总体方差:,子样本方差:
§3.2 简单估计量及其性质
一、总体均值的估计
(一)简单估计量的定义
对于分层样本,对总体的均值估计是通过对各层的子总体均值估计,按层权加权平均得到的。
因此总体均值估计量的公式为:(局部平均加权)
(3.1)
根据简单随机抽样:
,,分别是,,的估计量,而且它们都是无偏的。则此时公式为: (3.2)
(二)估计量的性质
定理3.1 对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。
定理3.2 的方差(均方误差)为:
(3.3/3.4)
证明:由于各层抽样是独立的,故上面两结论自然成立。 #
定理3.3 对于分层随机抽样,是的无偏估计,的方差为:
(3.6/3.7)
(3.8/3.9)
证明:显然 #
定理3.4 对于分层随机抽样,的一个无偏估计为:
(3.10)
(3.11/3.12)
证明:显然#
二、总体总量的估计
(一)简单估计量的定义
,
(二)估计量的性质
推论3.1 (1)对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差(均方误差)为:
证明:显然#
(2)对于分层随机抽样,是的无偏估计,的方差为:
证明:显然#
(3)对于分层随机抽样,的一个无偏估计为:
证明:显然#
例3.1 调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民划分为4层,每层按简单随机抽样抽取10
文档评论(0)