抽样误差与区间估计.pptxVIP

下载本文档

0
0
约2.44千字
约 10页
2025-04-17 发布于四川
举报
版权申诉

抽样误差与区间估计.pptx

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章总体均数的估计与假设检验

抽样误差(samplingerror)：由个体变异产生的、抽样造成的样本统计量与样本统计量之间、样本统计量与总体参数的差异。无倾向性、不可避免第一节均数的抽样误差与标准误

100份样本的均数和标准差

将这100份样本的均数看成新变量值，按第二章的频数分布方法，得到这100个样本均数得直方图见图3-1。图3-1随机抽样所得100个样本均数的分布

μ=4.83≠1100个样本均数中，各样本均数间存在差异，但各样本均数在总体均数周围波动。2样本均数的分布曲线为中间高，两边低，左右对称，近似服从正态分布。3样本均数的标准差明显变小：4100个样本均数的抽样分布特点：

即样本均数的标准差，可用于衡量抽样误差的大小。因通常σ未知，计算标准误采用下式：01标准误(standarderror,SE)02通过增加样本含量n来降低抽样误差。03

3个抽样实验结果图示

均数的均数围绕总体均数上下波动。均数的标准差即标准误与总体标准差相差一个常数的倍数，即从正态总体N(m,s2)中抽取样本，获得均数的分布仍近似呈正态分布N(m,s2/n)。抽样实验小结

概念不同：标准差是描述样本中个体值的变异程度的指标，其值越小，表示变量值围绕均数的波动越小；标准误是描述样本均数间变异度的指标，其值越小，表示样本均数围绕总体均数波动越小。用途不同：标准差用于表示变量值对均数波动的大小，当资料呈正态分布时，与均数结合可估计正常值范围，计算变异系数等；标准误用于表示样本统计量（样本均数、样本率）对总体参数（总体均数、总体率）的波动情况，可估计参数的可信区间，进行假设检验。标准差与标准误的区别与联系

与样本例数关系不同：样本量足够大时，标准差趋向稳定，标准误随例数增加而减小，甚至趋近于0，若样本量趋向总例数，则标准误接近0；01二者联系：均为变异指标，若把总体中各样本均数看作一个变量，则标准误可称为样本均数的标准差，当样本量不变时，均数的标准误与标准差成正比。二者均可与均数结合运用，但描述的内容各不相同。02

第二节t分布(t-distribution)随机变量XN（m，s2）标准正态分布N（0，12）Z变换均数标准正态分布N（0，12）Studentt分布自由度：n-1

以0为中心，左右对称的单峰分布；t分布曲线是一簇曲线，其形态变化与自由度的大小有关。自由度越小，则t值越分散，曲线越低平；自由度逐渐增大时，t分布逐渐逼近Z分布(标准正态分布)；当趋于∞时，t分布趋近Z分布，Z分布是t分布的特例。t分布的特征

图4-2不同自由度下的t分布图

界值表8122282.228tf(t)ν=10的t分布图t0.05/2,10=t0.025,10=2.228

相同自由度时，∣t∣值越大，概率P越小；在相同∣t∣值时，同一自由度的双侧概率是单侧概率的两倍，t0.05/2,10=t0.025,10。t界值表中的变化规律

A参数估计：用样本指标值（统计量）推断总体指标值（参数）。包括点估计和区间估计B第三节总体均数的可信区间估计

区间估计：在一定可信度（Confidencelevel）下，同时考虑抽样误差总体均数的点估计（pointestimation）与区间估计（intervalestimation）点估计：由样本统计量直接估计总体参数参数的估计按预先给定的概率(1??)，确定一个包含未知总体参数的范围。这一范围称为参数的可信区间或置信区间(confidenceinterval,CI)

(1??)称为可信度或置信度（confidencelevel），常取95％。置信区间通常两个数值即置信限(confidencelimit，CL)构成，较小的称为置信下限（lowerlimit，L），较大的称为置信上限（upperlimit，U），1置信区间的有关概念2

总体均数置信区间的计算01s未知，且n较小，按t分布s已知，或s未知但n足够大，按Z分布02

中心极限定理设从均值为μ，方差为的一个任意总体中抽取容量为n的样本，当n充分大（通常n≥50），样本均值的抽样分布服从均数为μ，方差为/n的正态分布。

单一总体均数的置信区间

例3-2已知某地27名健康成年男子血红蛋白含量=125g/L，S=15g/L，试估计该地健康成年男子血红蛋白平均含量的95%和99%置信区间。n=27，ν=27-1=26，查t界表,α=0.05，t0.05/2,26=2.056，α=0.01，t0.01/2,26=2.779，按公式计算

Z0.05/2=1.96Z0.05=1.645总体均数μ的单侧（1

您可能关注的文档

文档评论（0）

135****7720 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

抽样误差与区间估计.pptxVIP