医学统计学第六章资料.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 统计推断基础 公共卫生学院 白志茂 zhimaobai@163.com;统计方法的结构;6.1抽样误差与标准误 6.1.1 抽样误差 抽样误差:在抽样研究中产生的样本统计量与相应的总体参数之间的差异;来自同一总体的若干样本的统计量之间,也会存在误差,这种误差也反映了样本统计量和总体参数间的差异;抽样误差的表现形式: (1)样本统计量与总体参数间的差异 (2)不同样本统计量间的差异;抽样误差的类型:根据资料的性质和指标的类型不同,抽样误差有多种 (1)均数的抽样误差 (2)率的抽样误差 由于生物间的个体差异是客观存在的,因此在抽样研究过程中,抽样误差是不可避免的 抽样误差具有一定规律性;6.1.2 标准误 样本统计量的标准差称为标准误 标准误除了反映样本统计量之间的离散程度外,同时也反映样本统计量与相应的总体参数间的差异,即抽样误差大小。;最常用的标准误有两种,即均数的标准误和率的标准误;1)均数的标准误 将来自同一总体的若干个样本均数看作一组新的观察值,研究这些样本均数的频数分布,包括集中趋势与离散趋势,可计算样本均数的均数与标准差 ;【例】 某市16岁女中学生的身高分布服从均数(?)为155.4cm,标准差(?)为5.3cm的正态分布。作抽样模拟试验,每次随机抽出10个观察值(即样本例数n=10),共抽取100个样本 ;当原始观察值的分布为正态分布时,样本均数的频数分布基本接近正态分布。统计理论还证明,如果原始观察值分布为偏态分布,当样本例数n较大时,其样本均数的分布仍近似服从正态分布;均数标准误反映来自同一总体的样本均数的离散程度以及样本均数与总体均数的差异程度,即均数的抽样误差大小 均数标准误的计算 理论值: 估计值: 可适当增加样本例数和减少观察值的离散程度(如选择同质性较好的总体)来减少抽样误差。;均数标准误的用途 衡量样本均数的可靠性 估计总体均数的可信区间 用于均数的假设检验 ;2)率的标准误 率的标准误衡量样本率的离散趋势和率的抽样误差的统计指标。率的标准误愈大,则样本率的离散程度愈高,率的抽样误差愈大,反之亦然;率的标准误的计算 若总体率π为已知,当样本例数为n时 若总体率π未知,则以样本率代入,求得率的标准误的估计值 ;6.1.3 t分布 ;t分布曲线是一簇对称于0的曲线。 随着自由度增大,t分布曲线逐渐逼近标准正态曲线,当自由度为无穷大时,t分布曲线和标准正态曲线完全吻合;单侧(双侧)t界值(t分位数);6.2 参数估计 6.2.1 参数估计的意义 反映总体特征的统计指标称为参数(parameter) 在抽样研究中,对总体参数的估计是统计推断的主要内容之一。 参数估计就是用样本统计量估计总体参数。;6.2.2 估计方法 点估计(point estimation) 用样本统计量的值直接作为总体参数的估计值 优缺点:估计方法简单易行,但未考虑抽样误差 ;区间估计(interval estimation) 以一定概率估计总体参数在哪个范围内的这种估计方法称为区间估计 总体均数的区间估计 总体率π的区间估计;在正态分布N(μ,σ2) 中,若总体标准差σ已知时,总体均数μ的区间估计 ;;【例6.1】 已知某地150名正常成人脉搏均数73.53次/分,标准差11.30次/分,试估计该地正常成人脉搏总体均数95%可信区间。; 根据t分布的原理,当α=0.05时,有95%的t值在- t0.025, υ 到 t0.025, υ 间,即P (- t0.025, υ t t0.025, υ )=0.95,因此总体均数的95%可信区间估计 ;【例6.2】 随机抽取某地健康男子26人,测得该样本的血红蛋白均数为13.25g/dL,标准差为0.70g/dL,问该地健康男子血红蛋白总体均数的95%可信区间是多少? 解:;(2) 总体率π的区间估计 ①样本例数n较小时,特别是当p接近0或1时,可用查表法(附表5 百分率的可信区间)。 【例6.3】 某卫生防疫站随机检查某小学学生30人的粪便,发现5人蛔虫卵阳性,试问该校学生蛔虫感染率的95%可信区间是多少? 解:本例n=30,X=5,查附表5,得6-35,即该校学生蛔虫感染率的95%可信区间为6-35% ;② 样本例数n足够大,且样本率p和(1-p)都不太小时,如np与n(1-p)都大于5时,样本率p的抽样分布近似正态分布,;【例6.4】 某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况得阳性率为9.20%,求该地人群的乙型肝炎表面抗原阳性率的95%可信区间。按式(6.

文档评论(0)

118118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档