抽样调查教案6系统抽样.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样调查教案6系统抽样

第6章 系统抽样 §6.1 引言 6.1.1定义 定义6.1 /6.2系统抽样(systematic sampling)又称为等距抽样、机械抽样。按照这种抽样方法,从总体中抽取第一个样本点(随机起点),然后按某种固定的顺序和规律依次抽取其余的样本点,最终构成样本。这种抽样被称为系统抽样是因为这种抽样的第一个样本点虽然随机,但其余样本点的抽取看起来好像不再随机,因而是系统的。“牵一发而动全身”。比如要对居民用户抽样,可按户口册每隔多少户抽一户;工厂为检查产品质量,在连续的生产线上每隔20分钟抽选一个或若干个样品进行检查;农业上为估计农作物产量或病虫危害,对一大片农田每隔一定距离抽取一块进行实际测量或调查,等等。 本章只作简单方法介绍。更多内容参见文献2、文献3。 6.1.2系统抽样的一般方法 定义6.3 直线等距抽样 假设总体单元数为,样本容量为,为的整数倍。把总体单元排列成一直线。先计算出系统抽样间隔,(当不是的整数倍时,可令k等于最接近的整数)。然后在第一阶段1~k个单元中随机抽取一个单元,假设为r,然后每隔k个单元抽取一个单元,即分别为:r+k,r+2k,…….,直至抽取了n个单元。抽取的样本编号为:r+(j-1)k (j=1,2,…,n)。 1 2 … r ……k k+1 k+2 … k+r ……2k 2k+1 2k+2 … 2k+r ……3k … … … … …… … 例如某学院有200个学生,要抽取10个学生作为样本。首先计算=20,然后在1~20中随机抽取一个数字,假设抽中排列中第3位的学生,则其它入样单元依次为23,43,63,83,103,123,143,163,183。 定义6.4 圆形等距抽样(Lahiri) 这种方法主要适用于不为整数时。因为当k 不为整数,取其最接近的整数时,实际样本容量可能与n相差1,而且每个单元入样的概率不等,这时用直线等距抽样可能产生偏倚。 例:设总体N=10,其标志值分别为,总体均值为。若要求样本容量为n=3,采用直线等距抽样,验证样本均值是否为总体均值的无偏估计? 解:先计算间距=10/3=3.33….,取k=3,在1~3中取一个随机起点,然后每隔3个单元抽取1个单元可得下列的可能样本: 三个可能的系统抽样样本均值分别为: ,, 所有=,因此样本均值不是总体均值的无偏估计。 在这种情况下,样本均值将不等于总体均值,因而估计不是无偏的。为了使得样本均值是总体均值无偏估计,将个总体单元排成首尾相接的一个圆。抽样间距k 取最接近的整数,从1——中随机抽取一个随机起点作为起始单元,然后每隔k 个抽取一个,直到抽取n 个为止。如果序号大于时,将其减去得到的在1——中的号码入选。 正是因为排列为圆形而非直线且随机起点在1~N中而非在1~[k](或[k]+1)中,导致了该抽样下的每个样本严格等概率地被抽中,因而估计是无偏的。 若是圆形等距抽样,则在1~10中抽取一个随机起点,假设为7,然后每隔3个单元取一个,它们的序号是7、10、13。事实上是、、入样。 考虑到实际问题中,n通常比较大(大于等与50),多一个少一个并无关宏旨,因此可以不必考虑N/n不是整数的影响,故通常我们都假定N是n的整数倍。 3 不等概率抽样法 不等概率抽样中每个单元入样的概率不相等。最简单也是最常用的是系统抽样,即入样的概率与单元规模大小成比例的系统抽样。令表示所有单元规模大小总和,则(包含概率,见不放回不等概率抽样)。 在实际中,不等概率的实施常采用代码法。如下所示: 先将单元规模(不失一般性,设其为整数)值累加,欲从总体中抽取容量为n的样本,取最接近的整数k为抽样间距,从[1,k]中随机抽取一个整数r作为起点,则代码r,r+k,…,r+(n-1)k 所对应的单元入样。 例7.1 设总体由10个行政村组成,N=10,每个行政村人数为,见表7.1。利用系统抽样抽取n=3个行政村样本。 表7.1 用系统抽样抽取行政村 行政村编号 人数 累计人数 抽中号码 1 2 3 4 5 6 7 8 9 10 合计 103 432 96 246 84 73 205 168 146 317 1870 103 535 631 877 961 1034 1239 1407 1553 1870 100 * 723 * 1346 * ,从1~623中抽取一整数,例如是,则,,所对应的行政村入样,其序号分别为1、4、8。 这种方法,当所有单元规模时,每个单元不可能重复,是一种不重复抽样;当时(超过抽样间隔),第i个单元为必然被抽中单元,且有可能重

文档评论(0)

liwenhua00 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档