- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * 第十章 系统抽样 所谓系统抽样,就是将总体中N个单元按照随机方式(有时也按某种特定的规则)编号为1,2,…,N,若想抽取 n 个样本,不妨假设N/n=k为整数,利用计算机可以立即将这N个单元排成n 行k 列的矩阵,再从1~k之间随机地产生一个随机数 i ,则取第 i 列的全体单元作为样本。这种方法看起来似乎很“机械”,因此有时候也称为“机械抽样”。然而由于数值“ i ”是随机产生的,那么所得到的样本具有一定的随机性。 众所周知,计算机在抽样过程中起着十分重要的作用。 例如,前面提出利用计算机产生随机数,当然我们知道它产生的是“伪”随机数。本章所讨论的系统抽样在抽样过程中选择使用计算机将是十分方便的。 但在实际中,总体的N个单元的编号并非完全随机的, 常常带有一定的规律性,例如按照居住地区、工作性质等等 的编号,有时也常常利用一些个体原有的编号——诸如学生 的学号等。此时,系统抽样的随机性就与最有代表性的简单 随机抽样存在一定的差距。 考察N=nk这种最简单的情形,从总体中实施容量为 n 的 系统抽样相当于从k 列中随机地任取一列,显然每一列被选中 的概率是一样的,从而总体中每个单元入样的概率均相等, 这是N=nk时系统抽样的基本习性。 §1 系统抽样的若干习性 当 时,用上述计算机排列抽样的方法就不能保证 各单元入样的概率相同,因为有些列有 n 个单元,有些列不 足 n 个单元,当列不足 n 时,通常在 后再接上 ,依 原来顺序再排列下去,直到第 n 行填满单元为止,这样任取 的一列恰好保证有 n 个样本。但是,这样产生的后果是增大 了某些单元入样的概率。但当 n 足够大时(例如 ), 这时 不为整数所带来的问题并不大,因此,在以后需 要 n 比较大时,我们总是假设 N 是 n 的整数倍。 我们注意到一个有趣的事实:当用计算机将 N 个单元排 成 k 列 n 行时,实际上相当于将总体分为 k 层(或群),系 统抽样相当于从 k 个群中随机地抽出一个群进行整群抽样。 这是最简单的整群抽样!因此,在讨论系统抽样的参数估计 时,很多场合将引用整群抽样的一些现成结果。 系统抽样在实际工作中很受调研工作者的欢迎。首先在 于它的实施方便,同时还能保证样本一定程度的代表性。有 时候使用系统抽样不必重新编制抽样框,尤其是在被调查单 元具有自然顺序排列的时侯,例如流水线上生产的产品每隔 k 个抽查一次,只要第一件受检查产品确定以后,余下的抽 查工作将有条不紊地进行。 比如,对上海地区的车辆进行某种特性的抽样检测就可 以对车辆牌照采用系统抽样,譬如车牌号码尾数为39的车辆 必须到检测所参加测试就是每 100 个单元中抽一个系统抽样 如果总体中单元原来的排列呈现一定的规律性甚至周期 性,依赖于这些排列的系统抽样会产生效果很差的可能。系 统抽样的另一个不足之处在于,在实际中被认为行之有效的 系统抽样一般不是严格的概率抽样,估算估计量的方差有较 大困难。 §2 估计量与方差 既然将总体单元排列成 的矩阵,因此总体中各单 元的下标也有所改动以便于讨论与表达,见下表: 行平均 列平均 设系统样本为上表中的第 i 列,“ i ”随机等概率确定的 那么总体平均数就用该列的平均数进行估计: 这是只抽一个群的整群抽样估计,因此 是 的无偏估计 (10.1) 其方差为: (10.2) 利用 可得 其中 表示按列所分的层在 各层内的方差(之和)部分。 与容量为 n 的简单随机抽样的方差 比较 (10.3) (10.4) (10.3)式告诉我们,系统内(或层内)方差越大, 的方差 就越小;如果划分的层或系统内的差异趋于相当小, 则趋于极大值 ,倘若各系统内无差异,则 的 误差达到最大且与系统内各单元的个数 n 无关,这一点完全 符合直观。相反地,如果系统内的方差总大于总体的方差, 说明我们的系统抽样样本比简单随机样本更具有代表性(在 相同容量下),此时系统抽样的精度优于简单随机抽样的精 度。 在 时,我们已经指出系统抽样实际上是在群的大 小相等情形下的只抽一个群的整群
文档评论(0)