- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
四抽样误差与区间估计
第四章 抽样误差与区间估计 第一节 均数的抽样误差与标准误 从样本获取有关总体信息的过程称为统计推断(statistical inference)。 由个体差异产生的,抽样造成的样本与样本、样本与总体相应统计指标之间的差异,称为抽样误差(sampling error) 。 标准误(standard error, SE):样本统计量的标准差。 均数的标准误(SEM , ?X ) : 即样本均数的标准差。 样本观测值的标准差与样本均数的标准误的比较: 1.标准差与标准误都反映数据的离散性; 2.标准差的大小反映各个个体的观测值X之间的变异 程度(离散程度),标准误的大小反映各个样本均 数X间的变异程度(离散程度),也反映了样本均 数代表总体均数的可靠性。 数理统计推出: 1.从正态总体N( ?, ?2)中,随机抽取例数为n的样本,样本均数X也服从正态分布;即使从偏态总体随机抽样,当n足够大时,X也近似正态分布; 2.从均数为?,标准差为?的正态或偏态总体,抽取例数为n的样本,样本均数X的总体均数也为?,标准差用?X 表示,则?X可按下式计算: ?X = ? n X~ N( ?, ?2) ? X ~ N( ?, ) ? ?2 n ?X = ? n S X = S n 第二节 t分布 一. t分布的概念 X~ N( ?, ?2) ? X~ N( ?, ) ? ?2 n X- ? ~ N(0, ) ? ?2 X- ? ~ N(0, 1 ),即u分布。 ?/ n 用S代替?,得到 X- ? S/ n ~ t分布 n 二.t分布的图形和特征 以0为中心,左右对称的单峰分布; t分布曲线是一簇曲线,其形态变化与自由度?的大小有关。自由度?越小,则t值越分散,曲线越低平;自由度?逐渐增大时,t分布逐渐逼近u分布;当?= ?时,t分布即为u分布。 t分布曲线下总的面积等于1,即t值落入区间(- ?, ?)内的概率为1。t值落入任一区间 (t1,t2)内的概率等于该区间内曲线和横坐标轴所夹的面积。 附表2 t界值表通式: 单侧:P(t ? -t ?,?)= ?, 或P(t ? t ?,?)= ? 双侧: P(t ? -t ?/2,?) + P(t ? t ?/2,?)= ? 图中非阴影部分面积的概率为: P( -t ?/2,? t t ?/2,?)= 1-? 第三节 总体均数的估计 参数估计是指用样本指标值估计总体指标值。 包括点估计和区间估计。 点估计: 就是用样本统计量直接作为总体参数的估计值。 区间估计: 即按预先给定的概率(1-?)确定包含未知总体参数的可能范围。该范围称为参数的可信区间或置信区间 ,预先给定的概率称为可信度或置信度,常取95%或99%。 可信区间的确切含义指的是:有1- ?的可能认为计算出的可信区间包含了总体参数。 总体均数可信区间(confidence interval)的计算: 1. ?未知:按t分布。 由于P(-t ?/2, ? ? t ? t ?/2, ? )= 1- ?, -t ?/2, ? ? ? t ?/2, ? ? X- ? S/ n X- t ?/2, ? S n ? ? ? X + t ?/2, ? S n 2. ?已知或?未知但n足够大时:按u分布 双侧可信区间为: (X? u?/2 ? n )或 (X ? u?/2 s n ) 均数的可信区间与参考值范围的区别: 1.意义不同 均数的可信区间的统计意义: (1)按预先给定的概率,确定的包含总体均数的可能范围,因此它用于估计总体均数。 (2)可信度要高,但精度不能下降。 参考值范围的统计意义: “正常人”的解剖、生理、生化某项指标的波动范围,可以用于判断观察对象的某项指标正常与否。 2.两者的计算公式有差别:可信区间用了标准误,参考值范围用了标准差。 补充题 152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计和95%区间估计。 152例麻疹患儿病后血清抗体滴度倒数的分布 滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计 人
文档评论(0)