- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十讲 随机抽样方法
随机数最重要的特性是:它所产生的后面的那个数与前面
的那个数毫无关系。产生随机数有多种不同的方法。这些
方法被称为随机数发生器。
真正的随机数是使用物理现象产生的:
比如掷钱币、骰子、转轮、使用电子元件的噪音、核裂变
等等。这样的随机数发生器叫做物理性随机数发生器,它
们的缺点是技术要求比较高。
在实际应用中往往使用伪随机数就足够了。这些数列是
“似乎”随机的数,实际上它们是通过一个固定的、可以
重复的计算方法产生的。计算机或计算器产生的随机数有
很长的周期性。它们不真正地随机,因为它们实际上是可
以计算出来的,但是它们具有类似于随机数的统计特征。
这样的发生器叫做伪随机数发生器。
在真正关键性的应用中,比如在密码学中,人们一般使用
真正的随机数。
实际上是采用了线性同余法”。具体的计算如下:
Xi = (Xi-1 * A + C ) mod M
其中A,C,M都是常数 (一般会取质数)。当C=0时,叫做
乘同余法。srand()函数置的seed实际上会作为X0被代
入上式中,然后每次调用rand()函数都会用上一次产生
的随机值来生成新的随机值。这样我们可以看出实际上
用rand ()函数生成的是一个递推的序列,一切值都来源
于最初的seed。这就不难解释为什么当初始的seed取一
样的时候,得到的序列都相同。也就解释了为什么我们
需要调用系统时间这种变化的值来充当seed了。
C语言里面有RAND_MAX这样一个宏,定义了rand()所能
得到的随机值的范围。在C里可以看到RAND_MAX被定义
成0x7fff,也就是32767。据此我们可以推测rand ()函
数里递推式中M的值就是32767。据说在LInux里面这个
值被定义的更大一些,也就是说Linux里生成的随机值
的范围更大。
简单随机抽样 (纯随机抽样):
按等概率原则直接从含有N个元素
的总体中随机抽取n个元素组成样
本(Nn)。
概率抽样中最基本形式, 其他形
式都是以此为基础。
系统抽样 (等轴抽样、等距抽样、机
抽样):把总体的单位进行编号排序,
在计算出某中间隔,然后按这个固定的
间隔抽取个体的号 来组成样本的方法。
基本和简单随机抽样一样,计算公式也
一样。
需要完整的样本框,直接从总体中抽取
个体。
1. 给总体中的每一个个体按顺序编号,即指
定出样本框
2. 计算出抽样间距:K=N (总体规模)/n (样
本规模)
3. 在最前面的K个个体中,采用简单随机抽样
方法抽中一个个体,记下这个个体的编号,它
称做随机的起点。
4. 在抽样框中,每隔K个个体,抽取一个个体
5. 将这n个个体合起来,就构成了该总体的样
本。
由于系统抽样之简洁,在社会研究中大
多数情况下都采用该方法。
系统抽样的信度高低主要取决于总体数
据的分布,
如果总体的分布呈完全随机(杂乱无章),
则信度与简单随机抽样相同。
如果总体的分布呈逐渐增加或减小,则信度
高于简单随机抽样。
如果总体的分布呈周期性变化,则信度低于
简单随机抽样。
先将总体中的所有单位按某种特征或标志 (如性别、
能量、职业或地域等)划分成若干个类型或层次,
然后再在各个类型中采用简单随机抽样或系统抽样
的方法抽取一个子样本,最后,将这些子样本合起
来构成总体的样本。
从一个企业抽取职工样本。
–先将职工划分成工人、干部、技术人员三种
类型
–分别编制它们的样本框
–分别用简单随机抽样或系统抽样方法在各类
型中抽取子样本
–将三个子样本合在一起,就构成了该企业的
全体职工的样本。
1. 在不增加样本规模的情况下,降低抽
样误差,即提高抽样信度。
注意前提是,所分的类有意义,即每个
类内部数据的变异程度小,而类与类之
间变异程度大。
2. 非常便于了解总体内各层的情况。
比如:在《中国妇女社会地位调查》中,将
城市和乡镇分为两个类,以便于了解各自情
况,并可以比较。
分层的标准问题
1. 以所要分析和研
您可能关注的文档
最近下载
- photoshop实验指导书..doc VIP
- 文献阅读与数学写作:微积分的创立与发展++课件-2024-2025学年高二下学期数学人教A版(2019)选择性必修第二册.pptx VIP
- TPM全员生产维护培训课件(课件-36张).ppt VIP
- 《全国食品安全监督抽检实施细则》复习测试卷附答案.doc
- 一种铁电负电容晶体管的电路仿真模型及建模方法.pdf VIP
- 《智慧化税费申报与管理》教案 项目八 资源税和环境保护税智慧化申报与管理.docx VIP
- 建筑法培训课件.ppt VIP
- 铜陵铜化集团招聘考试试题.pdf
- 食品抽检复习试题有答案.doc
- 2025年秋季《南京照相馆》开学第一课主题班会课件.pptx VIP
文档评论(0)