四抽样误差与区间估计.pptVIP

下载本文档

5
0
约2.43千字
约 20页
2017-06-14 发布于浙江
举报
版权申诉

四抽样误差与区间估计.ppt

1、本文档共20页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

四抽样误差与区间估计

第四章抽样误差与区间估计第一节均数的抽样误差与标准误从样本获取有关总体信息的过程称为统计推断(statistical inference)。由个体差异产生的，抽样造成的样本与样本、样本与总体相应统计指标之间的差异，称为抽样误差(sampling error) 。标准误（standard error, SE）：样本统计量的标准差。均数的标准误（SEM ， ?X ）：即样本均数的标准差。样本观测值的标准差与样本均数的标准误的比较： 1.标准差与标准误都反映数据的离散性； 2.标准差的大小反映各个个体的观测值X之间的变异程度（离散程度），标准误的大小反映各个样本均数X间的变异程度（离散程度），也反映了样本均数代表总体均数的可靠性。数理统计推出： 1.从正态总体N（ ?， ?2）中，随机抽取例数为n的样本，样本均数X也服从正态分布；即使从偏态总体随机抽样，当n足够大时，X也近似正态分布； 2.从均数为?，标准差为?的正态或偏态总体，抽取例数为n的样本，样本均数X的总体均数也为?，标准差用?X 表示，则?X可按下式计算： ?X = ? n X~ N（ ?， ?2） ? X ~ N（ ?，） ? ?2 n ?X = ? n S X = S n 第二节 t分布一. t分布的概念 X~ N（ ?， ?2） ? X~ N（ ?，） ? ?2 n X- ? ~ N（0，） ? ?2 X- ? ~ N（0， 1 ），即u分布。 ?/ n 用S代替?，得到 X- ? S/ n ~ t分布 n 二.t分布的图形和特征以0为中心，左右对称的单峰分布； t分布曲线是一簇曲线，其形态变化与自由度?的大小有关。自由度?越小，则t值越分散，曲线越低平；自由度?逐渐增大时，t分布逐渐逼近u分布；当?= ?时，t分布即为u分布。 t分布曲线下总的面积等于1，即t值落入区间（- ?， ?）内的概率为1。t值落入任一区间（t1，t2）内的概率等于该区间内曲线和横坐标轴所夹的面积。附表2 t界值表通式：单侧：P（t ? -t ?,?)= ?, 或P（t ? t ?,?)= ? 双侧: P（t ? -t ?/2,?) + P（t ? t ?/2,?)= ? 图中非阴影部分面积的概率为: P（ -t ?/2,? t t ?/2,?)= 1-? 第三节总体均数的估计参数估计是指用样本指标值估计总体指标值。包括点估计和区间估计。点估计：就是用样本统计量直接作为总体参数的估计值。区间估计：即按预先给定的概率（1-?）确定包含未知总体参数的可能范围。该范围称为参数的可信区间或置信区间，预先给定的概率称为可信度或置信度，常取95%或99%。可信区间的确切含义指的是：有1- ?的可能认为计算出的可信区间包含了总体参数。总体均数可信区间(confidence interval)的计算： 1. ?未知：按t分布。由于P（-t ?/2， ? ? t ? t ?/2， ? ）= 1- ?， -t ?/2， ? ? ? t ?/2， ? ? X- ? S/ n X- t ?/2， ? S n ? ? ? X + t ?/2， ? S n 2. ?已知或?未知但n足够大时：按u分布双侧可信区间为：（X? u?/2 ? n ）或（X ? u?/2 s n ）均数的可信区间与参考值范围的区别： 1.意义不同均数的可信区间的统计意义：（1）按预先给定的概率，确定的包含总体均数的可能范围，因此它用于估计总体均数。（2）可信度要高，但精度不能下降。参考值范围的统计意义： “正常人”的解剖、生理、生化某项指标的波动范围，可以用于判断观察对象的某项指标正常与否。 2.两者的计算公式有差别：可信区间用了标准误，参考值范围用了标准差。补充题 152例麻疹患儿病后血清抗体滴度倒数的分布如下，试作总体几何均数的点值估计和95%区间估计。 152例麻疹患儿病后血清抗体滴度倒数的分布滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计人