- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
随机抽样中样本容量的确定
摘要:本文就随机抽样中对总体平均数进行参数估计或假设检验时,对样本的必要容量问题进行了讨论,对在总体方差已知和未知情况下,如何确定样本的必要容量进行了讨论,并对实际应用中必要样本容量的确定进行了合理的近似。
关键词:必要样本容量 随机抽样 置信水平
通过随机抽样的方法对总体参数进行估计或检验,确定随机抽样样本的容量n是一个非常重要的问题。如果样本容量n太大,会消耗大量的人力物力,造成不必要的浪费;如果样本容量n太小,会造成参数估计不精确,达不到规定的要求,进而影响假设检验的可靠性。因而科学地确定随机抽样中必要样本的样本容量n的大小,在实际应用中具有重要意义。
设总体X服从正态分布,即是抽自该总体的一个简单随机样本,则该样本也服从正态分布,即。
在 已知条件下的必要样本容量
在已知条件下,在对总体平均数进行参数估计时,我们可以得到总体平均数在的置信区间为。而在对总体平均数进行假设检验时,由于,对于给定的显著性水平,当假定原假设H0:μ=μ0成立时,因,由正态分布的对称性可知,,
即 (1)
(1)式回答了两个问题:一是当原假设H0:μ=μ0成立时,给出了H0的否定域;二是在μ未知时,给出了总体平均数μ在置信水平时的区间估计。
我们可以看到,在已知条件下,不论是对总体平均数进行参数估计还是假设检验,均得到了一个相同的置信区间:,记这个置信区间的长度为2△,其中,在实际工作中称△为估计精度或误差精度,它表示在的置信水平下,用样本平均数x估计总体平均数μ时所允许的最大绝对误差,它反映出了允许的最大绝对误差与置信水平和样本容量n之间的关系.如果给定了最大绝对误差与置信水平,就可以计算出此时的必要样本容量n: (2)
在未知条件下的必要样本容量
在未知条件下,我们可以得到总体平均数μ在置信水平下的置信区间为,而在对总体平均数进行假设检验时,由于,对于给定的显著性水平,当假定原假设H0:μ=μ0成立时,因,选择临界值,使得,
即 (3)
(3)式同样回答了两个问题:当原假设H0:μ=μ0成立时,给出了H0的否定域;二是在μ未知时,给出了总体平均数μ在置信水平时的区间估计
同样可以看到,在未知条件下,不论是对总体平均数进行参数估计还是假设检验,均得到了一个相同的置信区间
我们还是以表示样本平均数估计或检验总体平均数μ时所允许的最大绝对误差,在知道最大绝对误差与置信水平的前提下,我们可以计算出此时的必要样本容量n:
(4)
事实上,当总体方差未知时,我们可以用由经验确定的代替,对于给定的显著性水平,只要查得临界值,这时n的值就能由(4)式确定。但实际上,确定临界值本身,事先就需要知道n的值,即自由度n-1的值,因此(4)并没有真正解决n值的计算问题。然而,我们通过分析t分布临界值表可以发现,对于显著性水平≤0.05的情形,当n≥30时,其临界值≈2,这个临界值对于大于30的各个n值影响均不太大,因此我们可以采用近似公式
(5)
来计算n,如果计算出的n值大大超过30时,这与前面假定≈2是不矛盾的。
在实际的工作中,对于n的确定可按如下方式进行:根据S和△的值,由(5)式计算n的值,如果n的值大于30,就可以以这个n值作为样本的必要容量;若n值不大于30,则采用“试差法”来确定样本的必要容量n,即先由(5)式计算出一个n值,以这个n值作为第二次查临界值时的n,将查得的临界值代入(4)式再计算n值,再以求得的n作为第三次查临界值时的n,再将查得的临界值代入(4)式计算n值,如此循环,直到(4)式中两边的n值相同或相差很小时为止.一般要求计算出的n值不能小于5。
从上面的式子(2)、(4)我们可以看到,对总体平均数进行参数估计或假设检验时必要样本容量具有以下三个特点:
(1)总体方差或样本方差越大,必要样本的容量n就越大;
(2)最大允许误差△越小,必要样本的容量n就越大;
(3)置信水平越高,必要样本的容量n就越大。
参考文献:
[1]李贤平,沈崇圣,陈子毅.概率论与数理统计[M].复旦大学出版社,2005.
[2]邵志芳.心理与教育统计学[M].上海科学普及出版社,2004.
[3]耿修林.均值估计时样本容量的确定[J].统计与决策,2007,(10).
[4]刘爱芹.随机抽样中样本容量确定的影响因素分析[J].山东财政学院学报,2006,(05).
[5]陈克明,宁震霖.市场
原创力文档


文档评论(0)