卫生统计学专题六:总体均数与总体率的估计.docVIP

卫生统计学专题六:总体均数与总体率的估计.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卫生统计学专题六:总体均数与总体率的估计.doc

专题六 总体均数与总体率的估计 样本均数(或样本率)不能直接作为总体均数(或总体率)的估计,而应该考虑抽样误差的存在,借助抽样分布对总体均数(或总体率)做出估计。 一、均数的抽样误差 由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。在抽样研究中,抽样误差是不可避免的。 二、样本均数的分布及标准误 ⒈样本均数的分布:服从正态分布,样本均数大部分分布在总体均数的左右,中间多,两边少,左右基本对称。 ⒉标准误 样本均数的变异程度用样本均数的标准差来描述,样本均数的标准差称为均数的标准误,简称为标准误,符号σ。σ说明个样本均数围绕总体均数的离散程度,可用来反映样本均数的抽样误差的大小。 在抽样研究中,总体标准差常常未知,一般用样本标准差作为总体标准差的估计值。 理论公式: 实际公式: 注:⒈σ越大,样本均数分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。σ越小,样本均数分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。 ⒉标准差与标准误的区别:①标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。②标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。 ⒊以样本含量n从正态总体N(μ,σ)或偏态总体随机抽样,样本均数仍服从或者近似正态分布N(μ,σ)。 ⒋标准误的大小与标准差σ成正比,与样本含量n的平方根成反比。在实际工作中,可通过适当增加样本含量来减小抽样误差。 三、t分布 根据数理统计和中心极限定理:从均数为μ,标准差为σ的正态总体中,随机抽取例数为n的样本,样本均数均服从均数为μ,标准差为σ/的正态分布;即使从均数为μ,标准差为σ的偏态总体中随机抽样,当样本含量足够大时,样本均数的分布逐渐逼近于均数为μ,标准差为σ的正态分布。 已知样本均数服从正态分布,对正态变量实施z变换,使得正态分布N(μ,σ)变换为标准正态分布N(0,1)。 实际工作中,总体标准差常常未知,一般用样本标准差作为总体标准差的估计值,此时对样本均数进行的不再是z变换而是t变换。理论证明该统计量服从自由度为n-1的t分布。 t== υ=n-1 ⒈t分布曲线与分布的特征 如右图,t分布的特征有: ⑴单峰分布,在t=0处最高,且以0为中心左右对称。 ⑵不同自由度对应不同的t分布,t分布曲线是一簇曲线。 ⑶υ越小,t值越分散,曲线越平阔,尾部越高;随着υ增大, t值越集中,曲线越尖峭,尾部越低。 ⑷υ趋于∞时,t分布逼近标准正态分布(z分布)。 【说明】 ⒈t分布的极限分布为z分布。 ⒉t分布不是一条曲线,是一簇曲线,不同ν曲线下面积的分布 是不同的,相同面积可对应不同t界值,相同t界值可对应不 同面积。 ⒊t分布中,无论自由度为多少时,t分布曲线下的面积都为1。 ⒉t界值表 统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间 的关系编制了不同自由度下的t界值表(参见教材附表4)。 t界值表:横标目为自由度υ,纵标目为概率P。 t界值:表中数字表示当υ和P 确定时,单侧或双侧尾部面积P对应的t界值。 若P等于某预指定的α,则: 单侧尾端概率 (one-tailed probability)的t界值,即单侧尾部面积P对应的t界值用tα,υ表示。 双侧尾端概率 (two-tailed probability)的t界值,即两侧尾部面积P对应的t界值用tα/2,υ表示。 ⒊t分布规律 单侧:P(t≤-tα,υ)=α或P(t≥tα,υ)=α。 双侧:P(t≤-tα/2,υ)+P(t≥tα/2,υ)=α,则图中非阴影部分面积的概率为P(-tα/2,υ<t<tα/2,υ)=1-α 从t界值表可以看出: ⑴自由度相同时,t界值越大其对应的P值越小,反之亦然。 ⑵概率P(或尾部面积)相等时,υ越大,t界值越小。 ⑶t界值相等时,双侧概率为单侧概率的两倍。 ⑷υ=∞时,t界值即为z界值。例如,t0.05/2,∞=z0.05/2=1.96 四、总体均数的估计 统计推断的内容:参数估计(包括点估计与区间估计)和假设检验。参数估计:指用样本指标(统计量)估计总体指标(参数)。 ⒈点估计 ●方法:将样本统计量直接作为总体参数的估计值。 ●缺点:未考虑抽样误差的影响,估计的正确程度很难评价。 ⒉区间估计 ●方法:按事先给定的概率(1-α),估计包含未知总体参数的一个可能范围,该范围称为参数的可信区间或置信区间(CI)。 (1-α):可信度或置信度,也可表示为100(1-α)%,

您可能关注的文档

文档评论(0)

cnsg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档