网站大量收购独家精品文档,联系QQ:2885784924

抽样误差与区间估计.pptxVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第三章总体均数的估计与假设检验

抽样误差(samplingerror):由个体变异产生的、抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数的差异。无倾向性、不可避免第一节均数的抽样误差与标准误

100份样本的均数和标准差

将这100份样本的均数看成新变量值,按第二章的频数分布方法,得到这100个样本均数得直方图见图3-1。图3-1随机抽样所得100个样本均数的分布

μ=4.83≠1100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。2样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。3样本均数的标准差明显变小:4100个样本均数的抽样分布特点:

即样本均数的标准差,可用于衡量抽样误差的大小。因通常σ未知,计算标准误采用下式:01标准误(standarderror,SE)02通过增加样本含量n来降低抽样误差。03

3个抽样实验结果图示

均数的均数围绕总体均数上下波动。均数的标准差即标准误与总体标准差相差一个常数的倍数,即从正态总体N(m,s2)中抽取样本,获得均数的分布仍近似呈正态分布N(m,s2/n)。抽样实验小结

概念不同:标准差是描述样本中个体值的变异程度的指标,其值越小,表示变量值围绕均数的波动越小;标准误是描述样本均数间变异度的指标,其值越小,表示样本均数围绕总体均数波动越小。用途不同:标准差用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计正常值范围,计算变异系数等;标准误用于表示样本统计量(样本均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验。标准差与标准误的区别与联系

与样本例数关系不同:样本量足够大时,标准差趋向稳定,标准误随例数增加而减小,甚至趋近于0,若样本量趋向总例数,则标准误接近0;01二者联系:均为变异指标,若把总体中各样本均数看作一个变量,则标准误可称为样本均数的标准差,当样本量不变时,均数的标准误与标准差成正比。二者均可与均数结合运用,但描述的内容各不相同。02

第二节t分布(t-distribution)随机变量XN(m,s2)标准正态分布N(0,12)Z变换均数标准正态分布N(0,12)Studentt分布自由度:n-1

以0为中心,左右对称的单峰分布;t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近Z分布(标准正态分布);当趋于∞时,t分布趋近Z分布,Z分布是t分布的特例。t分布的特征

图4-2不同自由度下的t分布图

界值表8122282.228tf(t)ν=10的t分布图t0.05/2,10=t0.025,10=2.228

相同自由度时,∣t∣值越大,概率P越小;在相同∣t∣值时,同一自由度的双侧概率是单侧概率的两倍,t0.05/2,10=t0.025,10。t界值表中的变化规律

A参数估计:用样本指标值(统计量)推断总体指标值(参数)。包括点估计和区间估计B第三节总体均数的可信区间估计

区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差总体均数的点估计(pointestimation)与区间估计(intervalestimation)点估计:由样本统计量直接估计总体参数参数的估计按预先给定的概率(1??),确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidenceinterval,CI)

(1??)称为可信度或置信度(confidencelevel),常取95%。置信区间通常两个数值即置信限(confidencelimit,CL)构成,较小的称为置信下限(lowerlimit,L),较大的称为置信上限(upperlimit,U),1置信区间的有关概念2

总体均数置信区间的计算01s未知,且n较小,按t分布s已知,或s未知但n足够大,按Z分布02

中心极限定理设从均值为μ,方差为的一个任意总体中抽取容量为n的样本,当n充分大(通常n≥50),样本均值的抽样分布服从均数为μ,方差为/n的正态分布。

单一总体均数的置信区间

例3-2已知某地27名健康成年男子血红蛋白含量=125g/L,S=15g/L,试估计该地健康成年男子血红蛋白平均含量的95%和99%置信区间。n=27,ν=27-1=26,查t界表,α=0.05,t0.05/2,26=2.056,α=0.01,t0.01/2,26=2.779,按公式计算

Z0.05/2=1.96Z0.05=1.645总体均数μ的单侧(1

文档评论(0)

135****7720 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档