- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量资料的统计推断 第五章 参数估计 统计推断 在医学研究中,通常在总体中随机抽取一定数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特征,这个过程称为统计推断,包括参数估计和假设检验。 一、均数的抽样误差与标准误 抽样误差:由于抽样所引起的样本统计量(样本均数、标准差、样本率)间以及样本统计量与总体参数间的差异。 均数的抽样误差:由于抽样引起的样本均数与总体均数间以及样本均数之间的差异。 均数的抽样误差 样本均数的分布 1. 可表示抽样误差的大小,但μ未知,因而抽样误差大小不能直接得到,我们先来研究 的分布。 2.中心极限定理: (1)从 总体中随机抽取多个样本例数相等的样本,计算每个样本的均数 ,则 的分布也服从正态。 (2)x不服从正态分布,只要样本例数n足够大(n>50), 也近似正态分布。 样本均数的分布 3. 的总体均数为μ , 的总体标准差为 标准误(standard error,SE) 样本均数的标准差又称标准误,它反映了样本均数之间的离散程度,也反映了样本均数与总体均数间的差异,说明抽样误差的大小 。 样本均数标准误的估计值为: t分布(t-distribution) t 分布特点 以0为中心左右对称 自由度v越大,t分布越接近于正态,当v→∞时,t分布近似标准正态分布 t界值 纵坐标:自由度, υ 横坐标:概率, P, 即曲线下阴影部分的面积; 表中的数字:相应的 |t | 界值,用tα(v)表示。 t 值表规律: 自由度(υ)一定时,p 与 t 成反比; 概率(p) 一定时, υ 与 t 成反比; 二、样本率的抽样误差与标准误 1.样本率(P)与总体率(π)及样本率之间的差别,称为率的抽样误差。 2.率的标准误:即样本率的标准差,它描述了样本率的离散程度。 例5-2 某地2002年50岁以上的中老年妇女骨质疏松症的患病率为40%。现利用计算机从该总体中重复随机抽样10000次,每次抽取样本含量为30,每个样本计算其样本率。 图5-2(b)为其频数图。 参数估计的概念 参数估计:是指由样本统计量估计总体参数,是统计推断的一个重要内容。 点估计(point estimation) 区间估计(interval estimation) 1.点估计(point estimation) :用样本统计量直接作为总体参数的估计值。 2.区间估计(interval estimation) 是指按预先给定的概率(1-α)估计未知总体均数的可能范围(confidence interval, CI)该范围通常称为参数的可信区间或置信区间 。 可信度:置信度,指预先给定的概率1-α ,常取95%、99%。 可信限(confidence limit,CL) 可信区间的涵义:有1-α的可能性认为计算出的可信区间包含了总体参数。若做100次抽样算得100个可信区间,平均有95个可信区间包含总体参数。 总体均数可信区间的计算 1.σ未知 2.σ已知或σ未知但n足够大 σ已知 σ未知但n足够大 可信区间的两个要素 1.准确度:反映在可信度1-α的大小, 1-α越大越准确。 2.精密度:反映在区间的长度,区间长度越小精密度愈高。 在样本含量确定的情况下,二者是矛盾的。需要兼顾二者。在可信度确定的情况下,增加样本含量,可减少可信区间长度,提高精密度。 可信区间的含义 均数可信区间与参考值范围的区别 两总体均数之差的可信区间 总体率的可信区间 正态近似法 : n50,且np和n(1-p)都大于5时,样本率p近似正态分布,可信区间 查表法 n≤50,查表 小结 参数估计是统计推断的一个重要方面。均数的估计可利用t分布,总体率的估计可用正态近似法和查表法。 习题 1.抽样误差产生的原因是 A.观察对象不纯 B.非正态分布资料 C.个体差异 D.非分类变量资料 E.随机抽样方法错误 2.为了解某地区9岁女孩血红蛋白含量的平均水平,某医疗机构随机抽取该地9岁女孩200名,获得其血红蛋白含量均数为139.2g/L,标准差为2.5g/L,因而估计该地9岁女孩血红蛋白含量的平均水平为134.3~144.1g/L。试问该估计是否正确? 3.欲调查某煤矿工龄在5~10年的工人尘肺患病率,已知先期调查了25名工人,有4名患尘肺,其样本率为16%,标准误为7.33%,是否可用 估计煤矿工龄在5~10岁的工人尘肺患病率? * 总体 μ=5,σ=0.5 样本号 红
文档评论(0)