- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 简单随机抽样
第一节 简单随机抽样概述
一、简单随机抽样的概念
简单随机抽样也叫作纯随机抽样。其概念可有两种等价的定义方法:
定义之一:简单随机抽样就是从总体N个抽样单元中,一次抽取n个单元时,使全部可能的种不同的样本被抽到的概率均相等,即都等于1/A。
按简单随机抽样,抽到的样本称为简单随机样本。
按上述定义,在抽取简单随机样本之前,应将所有可能的互不相同的样本一一列举出来。但当N与n都比较大时,要列出全部可能的样本是不现实的。因此,按上述定义进行抽样是不太方便的。
定义之二:简单随机抽样是从总体的N个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n次,以抽中的n个单元组成简单随机样本。
由于定义二无需列举全部可能的样本,故比较便于组织实施。但按这个定义进行抽样时,仍然需要掌握一个可以赖以实施抽样的抽样框。
二、简单随机抽样的具体实施方法
常用的有抽签法和随机数法两种。
(一)抽签法
抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样本。
抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到等概率。因此,实际工作中常常使用随机数法。
(二)随机数法
随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n比较大时。
1、随机数表及其使用方法
随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。
所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。在编制时,使用一种特制的电器或用计算机,将0至9的10个数字随机地自动摇出,每个摇出的数字就是一个随机数字。为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。根据不同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。
目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,1955年出版的100万数字随机数表,它按五位一组排列,共有20万组;肯德尔和史密斯编制,1938年出版的10万数字随机数表,它也按五位一组排列,共有25000组。我国常用的是中国科学院数学研究所概率统计室编印的《常用数理统计表》中的随机数表。
随机数表的用途很多,不仅可以组织等概样本,也可组织不等概样本。
简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:
①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。
②设总体容量为N,若N的位数为r,则一定要从r位数中抽取。遇到1至N的数可直接使用;遇到其它的数不能直接使用。
③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。可从起点开始向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,中途不能变更。
④在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。
随机数表法一般分下述几步:
第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字(或距落点最近的数字)为奇数,则确定起点在第1页;否则,起点在第二页。
第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点的行数。由于每页只有50行,所以当落点处的两位数大于50时,则取其减去50的差数为行数。为保证等概性,当落点处的数为“00”时,则行数应取作50。然后依同样的方法再确定起点的列数。
第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或向右),每次取一个r位数。通常,若所需抽的数是一位数或两位数(即r=1或2),则由起点开始,依次向右抽取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移10位(或r位),再从第一行开始向下继续抽取,直到取足所需的n个r位数为止,以这n个r位数所对应的总体单元组成样本。
然而,按上述步骤抽样,由于每个总体单元只对应一个数字,因此,所读取随机数的放弃比例可能很高,这在大样本时将使抽样过程变得很费事。为避免这种现象,可以在不违反等概率原则的条件下令每个总体单元同时对应多个数字,以加快抽样的速度。
一般说来,当N为一个r位数字时,要取一个从一到N间的随机数字,可以随机取1至的一个数字,其中为N的最大r倍
您可能关注的文档
最近下载
- 《曾经》电影赏析.pptx VIP
- 钛合金薄壁鼓筒类零件加工变形控制.doc VIP
- 一种具有去除异味和抗菌功效的组合物及其制备方法与应用.pdf VIP
- 标准图集-15G107-1-装配式混凝土结构表示方法及示例(剪力墙结构).pdf VIP
- 公路统计年报要求及报表制度讲解.pptx
- TUCST007-2020 房屋建筑与市政基础设施工程施工安全风险评估技术标准.pdf VIP
- 临床营养病例讨论.ppt VIP
- 基层常见病的诊疗与管理题库答案-2025年华医网继续教育.docx VIP
- 中国心力衰竭诊断和治疗指南(2024)解读PPT课件.pptx VIP
- 世界水日-节约用水主题班会.ppt VIP
文档评论(0)