抽样调查教案-6系统抽样.docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章系统抽样 § 6.1引言 6.1.1定义 定义6.1 16.2系统抽样(systematic sampling又称为等距抽样、机械抽样。 按照这种抽样方法,从总体中抽取第一个样本点(随机起点) ,然后按某种固定 的顺序和规律依次抽取其余的样本点, 最终构成样本。这种抽样被称为系统抽样 是因为这种抽样的第一个样本点虽然随机,但其余样本点的抽取看起来好像不再 随机,因而是系统的。“牵一发而动全身”。比如要对居民用户抽样,可按户口册 每隔多少户抽一户;工厂为检查产品质量,在连续的生产线上每隔 20分钟抽选 一个或若干个样品进行检查;农业上为估计农作物产量或病虫危害, 对一大片农 田每隔一定距离抽取一块进行实际测量或调查,等等。 本章只作简单方法介绍。更多内容参见文献 2、文献3。 6.1.2系统抽样的一般方法 定义6.3直线等距抽样 假设总体单元数为N,样本容量为n,N为n的整数倍。把总体单元排列成 一直线。先计算出系统抽样间隔k 听,(当N不是n的整数倍时,可令k等于 最接近的整数)。然后在第一阶段1?k个单元中随机抽取一个单元,假设为 r, 然后每隔k个单元抽取一个单元,即分别为:r+k,r+2k,…….,直至抽取了 n kr_ J k r _ J k 厂 k+r k+r ( n-1) k+r (k为抽取间隔) 个单兀。抽取的样本编 号为: 叶(j- 1)k (j=1, 2, …,n)。 1 2 … r ……k k+1 k+2 … k+r ……2k 2k+1 2k+2 … 2k+r ……3k 例如某学院有200个学生,要抽取10个学生作为样本。首先计算k % = 20,然后在1?20中随机抽取一个数字,假设抽中排列中第3位的学生,贝U其它 入样单元依次为 23,43,63,83,103,123,143,163,183。 定义6.4圆形等距抽样(Lahiri ) 这种方法主要适用于k 忆不为整数时。因为当k不为整数,取其最接近 的整数时,实际样本容量可能与 n相差1,而且每个单元入样的概率不等,这时 用直线等距抽样可能产生偏倚。 例:设总体N = 10,其标志值分别为Yi,Y2,L,丫10,总体均值为Y 若要求样本容量为n = 3,采用直线等距抽样,验证样本均值是否为总体均值的 无偏估计? 丫2 丫5 丫8 /3,gysy1解:先计算间距k Nn = 10/3= 3.33….,取 丫2 丫5 丫8 /3,g ysy1 i 1 i 2 i 3 ¥ 丫4 丫7 丫10 丫2 丫5 丫8 丫3 丫6 丫9 起点,然后每隔3个单元抽取1个单元可得下列的可能样本: 三个可能的系统抽样样本均值分别为: 丫1 丫4 丫7 Y1o /4,ysy 2 丫3 丫6 丫9 /3 1 - 所有Eysy =3弘张环丫,因此样本均值不是总体均值的无偏估计。 在这种情况下,样本均值将不等于总体均值,因而估计不是无偏的。为了使 得样本均值是总体均值无偏估计,将 N个总体单元排成首尾相接的一个圆。抽 样间距k取最接近 %的整数,从1―― N中随机抽取一个随机起点作为起始单 元,然后每隔k个抽取一个,直到抽取n个为止。如果序号大于N时,将其减 去N得到的在1——N中的号码入选。 正是因为排列为圆形而非直线且随机起点在 1?N中而非在1?[k](或[k]+1)中, 导致了该抽样下的每个样本严格等概率地被抽中,因而估计是无偏的。 若是圆形等距抽样,则在1?10中抽取一个随机起点,假设为7,然后每隔3 个单元取一个,它们的序号是 7、10、13。事实上是丫7、丫10、丫3入样。 考虑到实际问题中,n通常比较大(大于等与50),多一个少一个并无关宏 旨,因此可以不必考虑 N/n不是整数的影响,故通常我们都假定 N是n的整数 倍。 3不等概率抽样法 不等概率抽样中每个单元入样的概率不相等。最简单也是最常用的是 PS系 N 统抽样,即入样的概率i与单元规模大小Mi成比例的系统抽样。令M。 Mi 1 表示所有单元规模大小总和,则i门业(包含概率,见不放回不等概率抽样)。 M。 在实际中,不等概率的实施常采用代码法。如下所示: 先将单元规模Mi (不失一般性,设其为整数)值累加,欲从总体中抽取容量 为n的样本,取最接近 匹 的整数k为抽样间距,从[1,k]中随机抽取一个整数 n r作为起点,则代码r,r+k,???,「+(n-1)k所对应的单元入样。 例7.1设总体由10个行政村组成,N = 10,每个行政村人数为Mj,见表7.1。 利用PS系统抽样抽取n= 3个行政村样本。 表7.1 用PS系统抽样抽取行政村 行政村编号 人数M i 累计人数 抽中号码 1 103 103 100 * 2 432 535 3 96 631 4 246 877 723 * 5 84 961

文档评论(0)

yuxiufeng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档