- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样误差参数估计.ppt
* 可信度1-α越大,则总体均数可信区间( ) A 越宽 B 越窄 C 不变 D 还与第二类错误有关 A 均数 率 事件数 方差 区间估计 1.区间估计的实质 假设某个总体的均数为μ,需要找到两个量A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含μ。即 P(AμB)=0.95 2.可信区间的定义 按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间。 可信区间(CL, CU )是一开区间 CL、CU 称为可信限 例题:血红蛋白浓度 为了解某地 1 岁婴儿的血红蛋白浓度,从该地区随机抽取 25 名 1 岁婴儿,测得其血红蛋白 试估计该地区1岁婴儿的平均血红蛋白浓度。 均 数 = 123.7(g/L) 标准差 = 11.9(g/L) 标准误=11.9/sqrt(25)=2.38 t 值的分布 理论基础:均数的抽样分布 -2.064 0 2.064 v=24 区间估计 可信区间(confidence interval): 区间(118.79, 128.61)包含了总体均数,其信度为95%。 可信度(1-α): 95% . 结论:该地区 1 岁婴儿的平均血红蛋白浓度为118.79~128.61(g/L)(可信度为95%)。 或:该地区 1 岁婴儿的平均血红蛋白浓度的95%可信区间为118.79~128.61(g/L)。 3.可信区间估计的理论基础 -均数的抽样分布 -t?/2, v 0 t?/2, v 1-? ?/2 ?/2 4.均数的可信区间构建方法 -t分布 均数的(1-?)100%的可信区间: 可信限(confidence limit): 可信度:1-α 参考值范围 4.均数的可信区间构建方法 -t分布 0 -u? u? ?/2 ?/2 1-? 4.均数的可信区间构建方法 -u分布 样本含量较大时,均数(1-?)100%的可信区间: 此时,均数的(1-?)100%的可信区间: 5.均数之差的(1-?)100%可信区间 例4.3 转铁蛋白含量(page39) 正常人:n1=12, 病人 :n2=15, 问题:两组平均相差多少? 问题: 正常组 病人组 ? 2=? 均 数: 235.21ug/dl 标准差: 14.39ug/dl ? 1=? 均 数: 271.89ug/dl 标准差: 10.28ug/dl ? 1- ? 2 =? 与均数之差有关的抽样分布 “均数之差”与“均数之差的标准误”之比, 服从自由度? = n1+n2 -2的 t 分布。 样本含量较大时,服从标准正态分布。 合并方差与均数之差的标准误 合并方差(方差的加权平均) 均数之差的标准误 根据 可得?1-?2的可信区间: 计算: 则合并方差为: 自由度为?=n1+n2-2=12+15-2=25、?=0.05的t界值为:t0.05,25=2.060 ,则两组均数之差的95%可信区间为: (271.89-235.21 ) ± 2.060 × 4.95 = 26.48 ~ 46.88 结论: 病毒性肝炎患者的血清转铁蛋白含量较正常人平均低36.68(?g/dl),其95%可信区间为26.48~46.88(?g/dl)。 6.可信区间的两个要素 可信度(1-?), 可靠性 一般取90%,95%。 可人为控制。 精确性 是指区间的大小(或长短) 兼顾可靠性、精确性 影响可信区间大小的因素 可信度 可信度越大,区间越宽 个体变异 变异越大,区间越宽 样本含量 样本含量越大,区间越窄 7.正确理解可信区间: 可信度为95%的CI的涵义: 每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。 这里的95%,指的是方法本身!而不是某个区间! 在可信区间被估计之前,概率是存在的; 在可信区间被估计之后,就没有概率了。 从N(0,1)中随机抽取100个n=10的样本
文档评论(0)