- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[简单随机抽样
简单随机抽样
一、放回简单随机抽样与不放回简单随机抽样
放回简单随机抽样(SRS with replacement),当从总体N个抽样单元中抽取n个抽样单元时,如果依次抽取单元时,不管以前是否被抽中过,每次都从N个抽样单元中随机抽取,这时,所有可能的样本为个(考虑样本单元的顺序),每个样本被抽中的概率为,放回简单随机抽样在每次抽取样本单元时,都将前一次抽取的样本单元放回总体,因此,总体的结构不变,抽样是相互独立进行的,这一点是它与不放回简单随机抽样的主要不同之处。放回简单随机抽样的样本量不受总体大小的限制,可以是任意的。
例:设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序):
1,1 2,1 3,1 4,1 5,1 1,2 2,2 3,2 4,2 5,2 1,3 2,3 3,3 4,3 5,3 1,4 2,4 3,4 4,4 5,4 1,5 2,5 3,5 4,5 5,5 不放回简单随机抽样(SRS without replacement),当从总体N个抽样单元中依次抽取n个抽样单元时,每个被抽中的单元不再放回总体,而是从总体剩下的单元中进行抽样。不放回简单随机抽样的样本量要受总体大小的限制。在实际工作中,更多的采用不放回简单随机抽样。
例:设总体有5个单元(1、2、3、4、5),按不放回简单随机抽样的方式抽取2个单元,则所有可能的样本为个:
1,2 2,3 3,4 4,5 1,3 2,4 3,5 1,4 2,5 1,5
二、抽样规则
简单随机抽样的抽取规则是:第一,按随机原则取样,在取样时排除任何主观因素选择抽样单元,避免任何先入为主的倾向性,防止出现系统误差。第二,每个抽样单元被抽中的概率都是已知的或事先确定的,或者是事先可以计算出来的。第三,每个抽样单元被抽中的概率都相等,即简单随机抽样属于一种等概率随机抽样。
三、估计量
一般人们只关注四个方面的总体特征:(1)总体均值;(2)总体总值;(3)总体比例;(4)总体比率
对上述总体特征的估计,有两条不同的思路:一是不借助任何辅助变量,仅仅通过变量的样本观察值对其总体特征进行直接估计,即用样本特征的线性组合表示总体特征,故统称为线性估计;另一条思路是借助相关辅助变量,对所感兴趣的变量的总体特征进行间接估计,用样本特征的非线性组合表示总体特征,故统称为非线性估计。至于相关辅助变量的选择必须满足:(1)与主变量高度相关;(2)其总体信息已知,不需要在本次调查中加以收集这两个条件。
相关的统计量如下表:
总体
样本
(等于0或1)
总体指标值上面带符号“^”的表示由样本得到的总体指标的估计。称为抽样比,记为f 。估计量的方差用大写的V表示,对的样本估计,不用而用表示。
四、简单估计量及其性质
引理1:从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元入样的概率为,两个特定单元都入样的概率为:
引理2:从总体规模为N的总体中抽取一个样本量为n的简单随机样本。如对总体中的每个单元,引进随机变量如下:则 ,
定理1:对于简单随机抽样,作为的简单估计,是无偏的。即
推论1:对于简单随机抽样,的期望为:
推论2:对于简单随机抽样,的期望为:
推论3:对于简单随机抽样,n较大时,的期望为:
定理2:对于简单随机抽样,的方差,,其中
推论1:对于简单随机抽样,的方差为:
推论2:对于简单随机抽样,的方差为:
推论3:对于简单随机抽样,n较大时,的期望为:
定理3:对于简单随机抽样,有,其中
为总体协方差
定理4:简单随机样本方差是总体方差的无偏估计
推论1:对于简单随机抽样,是的无偏估计
推论2:对于简单随机抽样,是的无偏估计
推论3:对于简单随机抽样,n较大时,
定理5:简单随机样本的协方差:是总体协方差的无偏估计。
实例:我们从某个=100的总体中抽出一个大小为=10的简单随机样本,要估计总体平均水平并给出置信度为95%的区间估计。
序号 1 2 3 4 5 6 7 8 9 10 4 5 2 0 4 6 6 15 0 8
由置信度95%对应的,因此,可以以95%的把握说总体平均水平大约在
之间,即2.4295和7.5705之间。
接上:估计总体总量,并给出在置信度95%的条件下,估计的极限相对误差。
,,
在置信度95%下,的极限相对误差为:
五、对总体的比例估计
某一类特征的单元占总体单元数中的比例P。将总体单元按是否具有这种特征划分为两类,设总体中有个单元具有A这个特征,如果对每个单元都定义指标值,
,
的方差为: ,
实例:某超市新开张一段时
文档评论(0)