网站大量收购独家精品文档,联系QQ:2885784924

《卫生统计学》第五章 参数估计基础.ppt

《卫生统计学》第五章 参数估计基础.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
-t t 0 正确理解可信区间的涵义 可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的可信度是针对可信区间的构建方法而言的。 以均数的可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按 构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。 在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值 。 图4.1 100个来自N(0,1)的样本所估计的可信区间示意 可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。 * * 第五章 参数估计基础 参数估计基础 抽样误差 t分布 可信区间 抽 样 误 差 抽样误差的概念 由抽样引起的样本统计量与总体参数间的差异 两种表现形式 样本统计量与总体参数间的差异 样本统计量间的差异 抽样研究 个体变异 抽样误差产生的条件 均数的抽样误差及标准误 表现一:样本均数与总体均数之差值 表现二:多个样本均数间的离散度 中心极限定理(central limit theorem) 从均数为?、标准差为?的总体中独立随机抽样,当样本含量n增加时,样本均数的分布将趋于正态分布,此分布的均数为?,标准差为 。 标准误(standard error,SE), 样本统计量的标准差称为标准误,用来衡量抽样误差的大小。 样本均数的标准差称为标准误。此标准误与个体变异? 成正比,与样本含量n的平方根成反比。 实际工作中,? 往往是未知的,一般可用样本标准差s代替? : 因为标准差s随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。 中心极限定理表明,即使从非正态总体中随机抽样,只要样本含量足够大,样本均数的分布也趋于正态分布 ,见图3.1 。 事实上,任何一个样本统计量均有其分布。统计量的抽样分布规律是进行统计推断的理论基础。 标准差与标准误的联系和区别 联系 都是变异指标。S反映个体观察值的变异;反映统计量的变异。 当n不变时,标准差↑,标准误↑ t 分布 t分布 设从正态分布N(?,?2)中随机抽取含量为n的样本,样本均数和标准差分别为 和s,设: 则t值服从自由度为n-1的t分布(t-distribution)。Gosset于1908年在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。 f(t) ? =∞(标准正态曲线) ? =5 ? =1 0.1 0.2 -4 -3 -2 -1 0 1 2 3 4 0.3 图3.2 自由度分别为1、5、∞时的t分布 t分布的特征 t分布为一簇单峰分布曲线 t分布以0为中心,左右对称 t分布与自由度?有关,自由度越小,t分布的峰越低,而两侧尾部翘得越高,;自由度逐渐增大时,t分布逐渐逼近标准正态分布;当自由度为无穷大时,t分布就是标准正态分布。 每一自由度下的t分布曲线都有其自身分布规律 t分布表明,从正态分布总体中随机抽取的样本,由样本计算的t值接近0的可能性较大,远离0的可能性较小。t0.05,10=2.228,表明,从正态分布总体中抽取样本含量为n=11的样本,则由该样本计算的t值大于等于2.228的概率为0.025,小于等于-2.228的概率亦为0.025。 P(t≤-2.228)+P(t≥2.228)=0.05 或:P(-2.228t2.228)=1-0.05=0.95。 可 信 区 间 抽样研究:从总体到样本 实际工作:由样本推断总体 统计推断(statistical inference)就是根据样本所提供的信息,以一定的概率推断总体的性质。 参数估计(parameter estimation) 由样本信息估计总体参数 点估计(point estimation) 区间估计(interval estimation) 点估计 直接用样本统计量作为总体参数的估计值 方法简单,但未考虑抽样误差的大小 在实际问题中,总体参数往往是未知的,但它们是固定的值,并不是随机变量值。而样本统计量随样本的不同而不同,属随机的。 区间估计 按一定的概率或可信度(1-? )用一个区间估计总体参数所在范围,这个范围称作可信度为1- ?的可信区间(confidence interval, CI),又称置信区间 。这种

文档评论(0)

lizhencai0920 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档