医学统计学抽样误差和可信区间.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
区间估计的实质 假设某个总体的均数为μ,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含μ。即 P(AμB)=0.95 可信区间的定义 按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间(confidence interval,CI),预先给定的概率(1-α)称为可信度或者置信度(confidence level),常取95%或99%。 可信区间(CL, CU )是一开区间 CL、CU 称为可信限 均数的(1-α)100%可信区间 -t?/2, v 0 t?/2, v 1-? ?/2 ?/2 均数的95%可信区间 样本含量不是很大时, 样本含量较大时,t分布逼近u分布 例: 【例4.1】 随机抽取某地25名正常成年男子,测得该样本的脉搏均数为73.6次/分,标准差为6.5次/分,求该地正常成年男子脉搏总体均数95%的可信区间。 【例4.2】 某市2001年120名7岁男童的身高=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。 均数之差可信区间的计算 正常组 肝炎组 ? 2=? 均 数: 231.86ug/dL 标准差:12.17ug/dL ? 1=? 均 数:273.18ug/dL 标准差:9.77ug/dL ? 1- ? 2 =? 合并方差与均数之差的标准误 合并方差(方差的加权平均) 均数之差的标准误 与均数之差有关的抽样分布 “均数之差”与“均数之差的标准误”之比, 服从自由度? = n1+n2 -2的 t 分布。 样本含量较大时,服从标准正态分布。 计算 可信区间的两个要素 可信度(Confidence):准确性,可靠性,即1-α。 一般取90%,95%,可人为控制 精确性(Precision):区间的大小,越小越好。 必须二者兼顾 可信区间的宽度及影响因素 均数的(1-α)可信区间为 则其宽度为 可信区间的宽度 可信度越大,可信区间越宽,说明用该区间来估计总体参数(总体均数)越可靠。 标准差越小,可信区间就越窄,意味着如果总体内变异程度较小时,在相同的可信度下,只需要一个比较窄的可信区间就可以估计总体均数。 随着样本含量的增加,可信区间逐渐变窄。 正确理解可信区间 可信度为95%的CI的涵义: 每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。 这里的95%,指的是方法本身!而不是某个区间! 总体参数虽未知,但却是固定的值,而不是随机变量值 。 95%可信区间的含义 -2 -1 0 1 2 按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。 下列说法正确吗? 算得某95%的可信区间,则: 总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该区间包含95%的总体参数。 该区间有95%的可能包含总体参数。 该区间包含总体参数,可信度为95%。 ? ? ? ? ? ? ? ? ? ? 概念辨析 标准差 ? 标准误 个体变异 ? 抽样误差 参考值范围 ? 可信区间 变量分布 ? 抽样分布 简述标准差和标准误的区别和联系 简述参考值范围与均数的可信区间的区别和联系 Yang Zhao, Department of Epidemiolgy Biostatistics Yang Zhao, Department of Epidemiolgy Biostatistics 抽样误差和可信区间 Sampling Error Confidence Intervals Medical statistics 医学统计学 主要内容(Content) 抽样误差及其规律性 标准误 抽样分布与t分布 统计推断与参数估计 总结 一.均数的抽样误差(sampling error)与标准误(standard error, SE) 抽样研究的目的是要用样本信息推断总体特征,称统计推断 1. 抽样误差的定义 假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。 μ=119.41cm σ= 4.38cm 三次抽样得到了不同的结果,原因何在? 个体变异 随机抽样 不同男童的身高不同 每次抽到的人几乎不同 抽样误差 【定义】由于个体变异的存在,在抽样研究

文档评论(0)

a13355589 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档