雷静《卫生统计学》第六章参数估计基础.pptVIP

雷静《卫生统计学》第六章参数估计基础.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 参数估计基础 抽样分布与抽样误差 t分布 总体均数及总体率的估计 抽样分布与抽样误差 在实际工作中,由于总体中各观察对象之间存在着个体变异,且随机抽取的样本又只是总体中的一部分,因此计算的样本统计量,不一定恰好等于相应的总体参数。 这种由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异,称为抽样误差(sampling error) 一、样本均数的抽样分布与抽样误差 实验6-1:假定某年某地13岁女生身高服从正态分布N(155.4,5.32)(cm)。利用计算机在该总体中随机抽取100个样本,每个样本n=30,即可求得如表6-1第(2)列中的100个样本均数。由这100个样本均数,可绘成样本均数的频率分布表(表6-2)。 观察样本均数抽样分布的特点 样本均数恰好等于总体均数的情况很少; 样本均数之间亦存在差异; 样本均数的分布围绕总体均数左右基本对称,呈近似正态分布; 样本均数之间的变异明显小于原始变量值之间的变异; 已证明: 从正态总体N( μ,σ2 )中,随机抽取例数为n的样本,样本均数 也服从正态分布,此正态分布为N ( μ, ) ; 均数的抽样误差——指由抽样而造成的样本均数与总体均数之间的差异。 称标准误,它说明均数抽样误差的大小。 n越大,标准误越小,样本均数的抽样误差亦越小 实际工作中,σ常未知,而是用样本标准差s来估计,则有 常用来说明均数的抽样误差的大小。 即使从偏态总体抽样,当n足够大时,样本均数也近似正态分布(见实验6-2,观察图6-1及图6-2的变化)。 二、样本频率的抽样分布与抽样误差 实验6-3,摸球实验。观察二项分布总体中样本频率的分布特征。 一个口袋内装有形状、重量完全相同的黑球和白球,其中黑球比例为20%(π=20%),从中重复摸球50次(ni=50),计算摸到黑球的频率(样本率pi)。这样的实验重复进行100次,将每次得到黑球的频率列成频率分布表即表6-3,观察表中的频率分布特征。 由此分布可知:样本率与样本率之间;样本率与总体率之间均存在差异,即抽样误差。 根据二项分布的原理,样本频率的总体概率为π,率的标准误为 σp= 实际工作中,总体率往往未知,常用样本率来近似代替总体率,则有 Sp = 反映率的抽样误差的大小。例6-1. t分布 前面讲过,对正态变量x采用 变换,则将正态分布N(μ,σ2)变换为标准正态分布N(0,1)。 已知样本均数也服从正态分布,那么对 采用Ζ变换,即可将其变换为标准正态分布。 但实际工作中 需用 来估计,这样,对正态变量采用的就不是Ζ变换而是t变换了,即 其结果即为t分布。观察t分布曲线图 t分布的特征:只有一个参数ν 以0为中心,左右对称的单峰分布; t分布是一簇曲线,形态变化与n(即自由度)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(Ζ分布)曲线。 t分布峰部较矮,尾部翘得较高,说明远侧的t值的个数相对较多,即尾部面积(概率P)较大。自由度ν越小这种情况越明显,ν渐大时,t分布渐逼近标准正态分布;当ν=∞时,t分布就成为标准正态分布了。 附表2,t界值表P467 总体均数及总体概率的估计 参数估计有两种方法: 1.点(值)估计:未考虑抽样误差 2.区间估计:可信区间又称置信区间 (confidence interval,CI) 指按一定的概率估计总体均数的可能范围。 概率1-α称为可信度(置信度),常取95%或99% 一、总体均数可信区间的计算** : 方法:1.t分布法: σ未知且n较小时 2.正态近似法: σ已知或σ未知但n较大时 1.t分布法:σ未知且n小时,某自由度的t曲线下有95%的t值在± 之间,即: 2.正态近似法: 1)σ已知时,正态曲线下有95%的Ζ值在±1.96之间,即: P(-1.96≤Ζ≤+1.96)=0.95 P(-1.96≤ ≤+1.96)=0.95 移项后整理得,总体均数μ的95%可信区间为 ( ) 2)σ未知,但n足够大(n50)时,可知t分布 逼近Ζ分布,此时t曲线下有95%的t值在±1.96之间 即:P(-1.96≤t

文档评论(0)

allap + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档