SAS软件应用之概率抽样方法PPT.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS软件应用之概率抽样方法PPT

样本量估算的影响因素 样本量的估算方法很多,不同的统计检验方法使用的计算公式也不一样,一般影响样本量的因素比较多: 研究事件的发生率:研究事件预期出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 样本量估算的影响因素 研究因素的有效率:有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 设定检验的第Ⅰ类错误概率α,即检验水准或显著性。即假设检验第一类错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者根据具体情况决定,通常α取0.05或0.01。 样本量估算的影响因素 设定检验的第Ⅱ类错误概率β,或检验效能1-β 。检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 样本量估算的影响因素 了解由样本推断总体的一些信息。总体标准差一般未知,用样本标准差s代替。 处理组间差别σ的估计,即确定容许误差。如果调查均数时,则先确定样本的均数和总体均数之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信区间的一半。 * * 第23章 概率抽样方法 学习目标 掌握简单随机抽样及SAS程序; 掌握系统(机械、等距)抽样及SAS程序; 掌握分层抽样及SAS程序; 掌握整群抽样及SAS程序。 概述 抽样调查可以分为两类,即概率抽样和非概率抽样。概率抽样是按照随机原则进行抽样,不加主观因素,组成总体的每个单位都有被抽中的概率(非零概率),可以避免样本出现偏差,样本对总体有很强的代表性。非概率抽样是按主观意向进行的抽样(非随机的),组成总体的很大部分单位没有被抽中的机会(零概率),使调查很容易出现倾向性偏差。 概述 现代被广泛应用的抽样调查是概率抽样。因此,现代的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法。它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体。 概述 概率抽样的原则,就是总体中的每一个样本被选中的概率相等。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好的按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。 概述 分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。 分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。 概述 分层标准为: 以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。 以那些有明显分层区分的变量作为分层变量。 概述 分层的比例问题: 按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。 不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。 概述 整群抽样:抽样的单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽出的若干个小群体内的所有元素构成调查的样本。对小群体的抽取可采用简单随机抽样、系统抽样和分层抽样的方法。 优点:简便易行、节省费用,特别是在总体抽样框难以确定的情况下非常适合。 缺点:样本分布比较集中、代表性相对较差。 一般来说,类别相对较多、每一类中个体相对较少的做法效果较好。 概述 多阶抽样(分段抽样):按照元素的隶属关系后层次关系,把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体分布的范围特别广时。 二重抽样(又称两相抽样):就是先抽取一个容量比较大的初始样本,用初始样本估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为“总体”,从中抽取容量合适的样本进行比较详细的调查。特点是,适合用于对总体信息了解比较

文档评论(0)

djdjix + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档