- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样调查教案6系统抽样
第6章 系统抽样
§6.1 引言
6.1.1定义
定义6.1 /6.2系统抽样(systematic sampling)又称为等距抽样、机械抽样。按照这种抽样方法,从总体中抽取第一个样本点(随机起点),然后按某种固定的顺序和规律依次抽取其余的样本点,最终构成样本。这种抽样被称为系统抽样是因为这种抽样的第一个样本点虽然随机,但其余样本点的抽取看起来好像不再随机,因而是系统的。“牵一发而动全身”。比如要对居民用户抽样,可按户口册每隔多少户抽一户;工厂为检查产品质量,在连续的生产线上每隔20分钟抽选一个或若干个样品进行检查;农业上为估计农作物产量或病虫危害,对一大片农田每隔一定距离抽取一块进行实际测量或调查,等等。
本章只作简单方法介绍。更多内容参见文献2、文献3。
6.1.2系统抽样的一般方法
定义6.3 直线等距抽样
假设总体单元数为,样本容量为,为的整数倍。把总体单元排列成一直线。先计算出系统抽样间隔,(当不是的整数倍时,可令k等于最接近的整数)。然后在第一阶段1~k个单元中随机抽取一个单元,假设为r,然后每隔k个单元抽取一个单元,即分别为:r+k,r+2k,…….,直至抽取了n个单元。抽取的样本编号为:r+(j-1)k (j=1,2,…,n)。
1 2 … r ……k
k+1 k+2 … k+r ……2k
2k+1 2k+2 … 2k+r ……3k
… … … … …… …
例如某学院有200个学生,要抽取10个学生作为样本。首先计算=20,然后在1~20中随机抽取一个数字,假设抽中排列中第3位的学生,则其它入样单元依次为23,43,63,83,103,123,143,163,183。
定义6.4 圆形等距抽样(Lahiri)
这种方法主要适用于不为整数时。因为当k 不为整数,取其最接近的整数时,实际样本容量可能与n相差1,而且每个单元入样的概率不等,这时用直线等距抽样可能产生偏倚。
例:设总体N=10,其标志值分别为,总体均值为。若要求样本容量为n=3,采用直线等距抽样,验证样本均值是否为总体均值的无偏估计?
解:先计算间距=10/3=3.33….,取k=3,在1~3中取一个随机起点,然后每隔3个单元抽取1个单元可得下列的可能样本:
三个可能的系统抽样样本均值分别为:
,,
所有=,因此样本均值不是总体均值的无偏估计。
在这种情况下,样本均值将不等于总体均值,因而估计不是无偏的。为了使得样本均值是总体均值无偏估计,将个总体单元排成首尾相接的一个圆。抽样间距k 取最接近的整数,从1——中随机抽取一个随机起点作为起始单元,然后每隔k 个抽取一个,直到抽取n 个为止。如果序号大于时,将其减去得到的在1——中的号码入选。
正是因为排列为圆形而非直线且随机起点在1~N中而非在1~[k](或[k]+1)中,导致了该抽样下的每个样本严格等概率地被抽中,因而估计是无偏的。
若是圆形等距抽样,则在1~10中抽取一个随机起点,假设为7,然后每隔3个单元取一个,它们的序号是7、10、13。事实上是、、入样。
考虑到实际问题中,n通常比较大(大于等与50),多一个少一个并无关宏旨,因此可以不必考虑N/n不是整数的影响,故通常我们都假定N是n的整数倍。
3 不等概率抽样法
不等概率抽样中每个单元入样的概率不相等。最简单也是最常用的是系统抽样,即入样的概率与单元规模大小成比例的系统抽样。令表示所有单元规模大小总和,则(包含概率,见不放回不等概率抽样)。
在实际中,不等概率的实施常采用代码法。如下所示:
先将单元规模(不失一般性,设其为整数)值累加,欲从总体中抽取容量为n的样本,取最接近的整数k为抽样间距,从[1,k]中随机抽取一个整数r作为起点,则代码r,r+k,…,r+(n-1)k 所对应的单元入样。
例7.1 设总体由10个行政村组成,N=10,每个行政村人数为,见表7.1。利用系统抽样抽取n=3个行政村样本。
表7.1 用系统抽样抽取行政村
行政村编号 人数 累计人数 抽中号码 1
2
3
4
5
6
7
8
9
10
合计 103
432
96
246
84
73
205
168
146
317
1870 103
535
631
877
961
1034
1239
1407
1553
1870 100 *
723 *
1346 *
,从1~623中抽取一整数,例如是,则,,所对应的行政村入样,其序号分别为1、4、8。
这种方法,当所有单元规模时,每个单元不可能重复,是一种不重复抽样;当时(超过抽样间隔),第i个单元为必然被抽中单元,且有可能重
文档评论(0)