抽样样本量的确.ppt

  1. 1、本文档共88页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样样本量的确

样本量的确定 对于小规模总体,通常必须调查较大比例的样本,以取得所期望的精度。因此,实际操作中,对小规模总体经常采用普查而不是抽样调查。 计算样本容量时,通常假定采用的抽样方式为简单随机抽样(SRS)。所以,如果样本容量计算公式假定为简单随机抽样。 6.样本设计和估计量 分层抽样得到的估计值通常比相同规模的简单随机抽样更精确,或者至少 一样精确。 整群抽样得到的估计值,其精度通常低于使用同一估计量进行估计时的简单随机抽样的估计值的精度 设计效果因子 一般来说,当样本容量的计算公式假定为简单随机抽样SRS,但使用的是更复杂的选样方式时,达到既定精度所需的样本容量应该乘以设计效果因子。 设计效果=对于同样规模的样本容量,给定样本设计下 估计量的抽样方差对简单随机抽样估计量的 抽样方差的比率。 对于简单随机抽样设计,设计效果 = 1 对于分层抽样设计,设计效果 ? 1 对于整群抽样设计,设计效果 ? 1 7.回答率 所有的调查都会遇到无回答的困扰即: 由于某些原因,不能获得被抽中样本单位的信息 当一个被调查单位的所有或几乎所有的数据都缺 失时,我们就称之为完全无回答(或称单位无回答) 某次调查的回答率是用调查得到的有效问卷数占 预期样本容量的一个百分比来表示的 完全无回答会减少有效样本的数量,从而会增加 抽样误差,并进而降低估计值的精度 例如,如果初始样本容量是400,而通过上述途径估计的回答率为75%,那么选择的样本容量就应该为: 根据预计的回答率调整样本容量 一个最简单的例子 没有无回答的简单随机抽样样本容量的计算公式 简单随机抽样下,通常使用误差界限和估计量的标准误来确定所需的样本容量。 在无放回简单随机抽样情况下 总体均值估计量的标准误差的表达式 其中,S 是总体的标准差 如果误差界限设为e,那么: 解n,得: 这里Z是对应于某一置信水平的标准正态分布的分位点值。 其中,总体方差S2是最不容易得到的,通常需要根据过去对类似总体所做的研究作近似计算。 为确定n,需要知道 期望的误差界限e 置信水平 对应的标准正态分布的分位点值 Z 总体规模 N 总体方差 S2 求比例样本容量的确定 下面用一个例子,说明估计比例问题时样本容量的确定过程。 在这一例子中,所需的精度是根据误差界限确定的,所研究的指标取两个值,即P和1-P。 在这种情况下,对于大总体,且估计量服从正态分布时, P的总体方差为: 若总体真值已知,那么直接将它代入上面的等式 就可以得到样本容量 若总体真值未知,而且也没有以前的信息可以利 用,那么可以P=0.5 用,因为这时的方差最大, 可以求得一个比较保守的样本容量 计算比例估计样本容量的详细步骤 先计算初始样本容量,然后根据总体的大小、设计效果和回答率分别对它进行调整,最后求得最终的样本容量。 第1步:计算初始样本容量 注意,公式(1)使用了有限总体校正因子n/N,对总体规模进行校正。如果忽略这个因子,初始样本容量n1就可以按下列公式计算: 如果e 和 P都不用比例表示,而用百分数表示, n1 的计算公式同样成立。 第2步:使用下列等式对总体的大小进行调整 第3步:设计效果调整样本容量 如果样本设计不是采用简单随机抽样,那么可以使用下列公式,即用抽样设计效果对样本容量进行调整 : 其中,是设计效果,并且有: 在简单随机抽样设计下,B = 1, 在分层抽样设计下, B ? 1, 在整群抽样设计下, B ? 1。 根据无回答再次进行调整,以确定最终的样本容量n 其中, r = 估计的回答率。 第4步:无回答调整样本容量 样本容量确定的例子 下面用实例说明样本容量的计算过程 。 例 1. 某杂志出版商希望得到读者对该杂志综合满意程度的估计值。通过邮寄调查,出版商可以联系到所有的2500个订户。但是,由于时间的限制,出版商决定使用简单随机抽样进行电话调查。请问应访问多少个读者 ? 如果真实的总体比例落在总体比例的样本估计值的?0.10范围内,则该出版商将感到满意。 换句话说,误差界限e为0.10 。 出版商希望调查估计值的置信度为95%,这就意味着20次抽样中只有1次,所得的样本估计值确定的置信区间不包含总体真值P,而且,Z=1.96。 使用简单随机抽样SRS。 估计回答率为

文档评论(0)

haowendangqw + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档