卫生统计学专题六：总体均数与总体率的估计.docVIP

下载本文档

39
0
约4.21千字
约 3页
2015-08-07 发布于河南
举报
版权申诉

卫生统计学专题六：总体均数与总体率的估计.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

卫生统计学专题六：总体均数与总体率的估计.doc

专题六总体均数与总体率的估计样本均数（或样本率）不能直接作为总体均数（或总体率）的估计，而应该考虑抽样误差的存在，借助抽样分布对总体均数（或总体率）做出估计。一、均数的抽样误差由个体变异产生的，随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。在抽样研究中，抽样误差是不可避免的。二、样本均数的分布及标准误 ⒈样本均数的分布：服从正态分布，样本均数大部分分布在总体均数的左右，中间多，两边少，左右基本对称。 ⒉标准误样本均数的变异程度用样本均数的标准差来描述，样本均数的标准差称为均数的标准误，简称为标准误，符号σ。σ说明个样本均数围绕总体均数的离散程度，可用来反映样本均数的抽样误差的大小。在抽样研究中，总体标准差常常未知，一般用样本标准差作为总体标准差的估计值。理论公式：实际公式：注：⒈σ越大，样本均数分布越分散，样本均数与总体均数的差别越大，抽样误差越大，由样本均数估计总体均数的可靠性越小。σ越小，样本均数分布越集中，样本均数与总体均数的差别越小，抽样误差越小，由样本均数估计总体均数的可靠性越大。 ⒉标准差与标准误的区别：①标准差表示个体差异的大小；标准误描述样本均数的变异程度，说明抽样误差的大小。②标准差描述资料的频数分布状况，可用于制定医学参考值范围；而标准误用于总体均数的区间估计和假设检验。 ⒊以样本含量n从正态总体N（μ，σ）或偏态总体随机抽样，样本均数仍服从或者近似正态分布N（μ，σ）。 ⒋标准误的大小与标准差σ成正比，与样本含量n的平方根成反比。在实际工作中，可通过适当增加样本含量来减小抽样误差。三、t分布根据数理统计和中心极限定理：从均数为μ，标准差为σ的正态总体中，随机抽取例数为n的样本，样本均数均服从均数为μ，标准差为σ／的正态分布；即使从均数为μ，标准差为σ的偏态总体中随机抽样，当样本含量足够大时，样本均数的分布逐渐逼近于均数为μ，标准差为σ的正态分布。已知样本均数服从正态分布，对正态变量实施z变换，使得正态分布N（μ，σ）变换为标准正态分布N（0,1）。实际工作中，总体标准差常常未知，一般用样本标准差作为总体标准差的估计值，此时对样本均数进行的不再是z变换而是t变换。理论证明该统计量服从自由度为n-1的t分布。 t== υ=n-1 ⒈t分布曲线与分布的特征如右图，t分布的特征有： ⑴单峰分布，在t=0处最高，且以0为中心左右对称。 ⑵不同自由度对应不同的t分布，t分布曲线是一簇曲线。 ⑶υ越小，t值越分散，曲线越平阔，尾部越高；随着υ增大， t值越集中，曲线越尖峭，尾部越低。 ⑷υ趋于∞时，t分布逼近标准正态分布（z分布）。【说明】 ⒈t分布的极限分布为z分布。 ⒉t分布不是一条曲线，是一簇曲线，不同ν曲线下面积的分布是不同的，相同面积可对应不同t界值，相同t界值可对应不同面积。 ⒊t分布中，无论自由度为多少时，t分布曲线下的面积都为1。 ⒉t界值表统计学家将t分布曲线下的尾部面积（即概率P）与横轴t值间的关系编制了不同自由度下的t界值表（参见教材附表4）。 t界值表：横标目为自由度υ，纵标目为概率P。 t界值：表中数字表示当υ和P 确定时，单侧或双侧尾部面积P对应的t界值。若P等于某预指定的α，则：单侧尾端概率 (one-tailed probability)的t界值，即单侧尾部面积P对应的t界值用tα,υ表示。双侧尾端概率 (two-tailed probability)的t界值，即两侧尾部面积P对应的t界值用tα/2,υ表示。 ⒊t分布规律单侧：P（t≤-tα,υ）=α或P（t≥tα,υ）=α。双侧：P（t≤-tα/2,υ）＋P（t≥tα/2,υ）=α，则图中非阴影部分面积的概率为P（-tα/2,υ＜t＜tα/2,υ）=1-α 从t界值表可以看出： ⑴自由度相同时，t界值越大其对应的P值越小，反之亦然。 ⑵概率P（或尾部面积）相等时，υ越大，t界值越小。 ⑶t界值相等时，双侧概率为单侧概率的两倍。 ⑷υ=∞时，t界值即为z界值。例如，t0.05/2，∞=z0.05/2=1.96 四、总体均数的估计统计推断的内容：参数估计（包括点估计与区间估计）和假设检验。参数估计：指用样本指标（统计量）估计总体指标（参数）。 ⒈点估计 ●方法：将样本统计量直接作为总体参数的估计值。 ●缺点：未考虑抽样误差的影响，估计的正确程度很难评价。 ⒉区间估计 ●方法：按事先给定的概率（1-α），估计包含未知总体参数的一个可能范围，该范围称为参数的可信区间或置信区间（CI）。（1-α）：可信度或置信度，也可表示为100（1-α）%，