- 1、本文档共84页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
03 抽样误差区间估计
可信区间(confidence interval): 结论:估计口腔癌患者发锌含量总体均数为193.23~321.87(?g/g),可信度为95%。 当样本含量较大时,例如n>100,t分布近似标准正态分布,此时可用标准正态分布代替t分布,作为可信区间的近似计算。相应的100(1-?)%可信区间为: 例4.2 某市2001年120名12岁正常男孩身高均数为142.67cm,标准误为0.5477cm,计算该市12岁正常男孩身高总体均数90%的可信区间。 -t t 0 例4.2 n=120100,标准正态分布代替t分布,u0.10=1.64 142.67± 1.64 ×0.5477= 141.77~143.57 即该市12岁男童平均身高的90%可信区间为:141.77~143.57(cm),可认为该市12岁男童平均身高在141.77~143.57(cm)之间 。 6 )均数之差的(1-?)100%可信区间 例4.3 转铁蛋白含量(page41) 正常人:n1=12, 病人 :n2=15, 问题:两组平均相差多少? 问题: 正常组 病人组 ? 2=? 均 数: 235.21ug/dl 标准差: 14.39ug/dl ? 1=? 均 数: 271.89ug/dl 标准差: 10.28ug/dl ? 1- ? 2 =? 与均数之差有关的抽样分布 “均数之差”与“均数之差的标准误”之比, 服从自由度? = n1+n2 -2的 t 分布。 样本含量较大时,服从标准正态分布。 合并方差与均数之差的标准误 合并方差(方差的加权平均) 均数之差的标准误 计算: 则合并方差为: 自由度为?=n1+n2-2=12+15-2=25、?=0.05的t界值为:t0.05,25=2.060 ,则两组均数之差的95%可信区间为: (271.89-235.21 ) ± 2.060 × 4.95 = 26.48 ~ 46.88 结论: 病毒性肝炎患者的血清转铁蛋白含量较正常人平均低36.68(?g/dl),其95%可信区间为26.48~46.88(?g/dl)。 可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。所谓95%的可信度是针对可信区间的构建方法而言的。 以均数的可信区间为例,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按 构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。 正确理解可信区间: 95%可信区间的含义 -2 -1 0 1 2 按这种方法构建的可信区间,理论上平均每100次,有95次可以估计到总体参数。 正确理解可信区间的涵义 在区间估计中,总体参数虽未知,但却是固定的值(且只有一个),而不是随机变量值 。 下列说法正确吗? 算得某95%的可信区间,则: 总体参数有95%的可能落在该区间。 有95%的总体参数在该区间内。 该区间包含95%的总体参数。 该区间有95%的可能包含总体参数。 该区间包含总体参数,可信度为95%。 ? ? ? ? ? ? ? ? ? ? 可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只有一个 。 参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限 。 95%的可信区间中的95%是可信度,即所求可信区间包含总体参数的可信程度为95% 95%的参考值范围中的95%是一个比例,即所求参考值范围包含了95%的正常人。 标准差与标准误的联系 都是变异指标。 当n不变时,标准差↑,标准误↑ 标准差与标准误的区别 标准差描述原始数据的离散程度; 标准误反映均数的抽样误差大小。 标准差与标准误的区别 标准差衡量样本均数对原始数据的代表性 ,标准差越小,样本均数对原始数据的代表性越好; 标准误衡量样本均数估计总体均数的精确性,标准误越小,样本均数估计总体均数精度越高。 标准差与标准误的区别 当 n→N 时,样本标准差→总体标准差 当 n→N 时,标准误→0 标准差与标准误的区别 结合样本均数和正态分布的规律,标准差估计参考值范围 ; 结合样本均数和t分布的规律,标准误估计总体均数的可信区间 。 注意区别: 标准差 ? 标准误 个体变异 ? 抽样误差 参考值范围 ? 可信区间 变量分布 ? 抽样分布 * 总结 抽样误差 中心极限定理 标准误 抽样分布 参数估计 * * * 可信区间有两个特征:把握度和精度。把握度是指可信区间包含总体参数的可能性,精
文档评论(0)