[医学]第04章 抽样误差与假设检验.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[医学]第04章 抽样误差与假设检验

第四章 抽样误差与假设检验 (Sampling Error and Hypothesis Test) 问题提出 研究方法:对总体进行研究,抽样研究 除对关乎国计民生和严重危害人民健康的需对总体进行研究外,一般用抽样研究 有些领域只能用抽样研究方法 研究的目的是对总体下结论,而研究信息来自样本 问题提出 样本统计量(样本均数)与总体参数(总体均数)有否差异? 若有差异,其规律如何?用什么指标来衡量? 怎样用样本信息来推断总体,从而作出结论。 第一节 均数的抽样误差与标准误 一、均数的抽样误差 抽样误差的概念 由于抽样而引起的样本均数与总体均数间差异称为均数抽样误差 其他统计指标在样本与总体间也存在着抽样误差 由于抽样而引起的样本统计指标与总体参数间的差异称为抽样误差 本质是个体存在差异, 二、抽样误差的分布 理论上可以证明:若从正态总体 中,反复多次随机抽取样本含量固定为n 的样本,那么这些样本均数 也服从正态分布,即 的总体均数仍为 。 中心极限定理: 当样本含量很大的情况下,无论原始测量变量服从什么分布, 的抽样分布均近似正态。 三、标准误(Standard Error) 样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小: 实际中总体标准差 往往未知,故只能求得样本均数标准误的估计值 : 例4.1 在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38 ×1012/L ,试计算均数的标准误。 标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。 第二节t分布      ——t值与t分布的引入 t分布 特征 t分布 特征 自由度ν越大,t分布越接近于正态分布;当自由度ν逼近∞时,t分布趋向于标准正态分布。 自由度ν不同,曲线形态不同, t分布是一簇曲线 概率?、自由度?与t值关系          ——t界值 标准正态分布中u值大小与尾部面积(概率?)有关,以 (单侧)和u?/2(双侧)表示; 在t分布中,当自由度一定时?越小,|t|越大; 在?一定时,自由度越小,|t|越大,大于u值 在t分布中,t值与?、?的大小有关; 在单侧时(尾部面积取单侧)t 界值表示为t ?,? , 双侧时表示为t?/2,? ,其意义为 概率?、自由度?与t值关系         ——t界值 一定自由度?和概率?下的 t值t ?,? , t?/2,? 可通过查t界值表——附表2获得; 例如?=9,单侧?=0.05 ,查附表2得单侧 t0.05,9=1.833 自由度??n-1?35-1?34 ,查附表2,得t0.05/2,34=2.032 第三节 总体均数的估计 一、可信区间的概念(Confidence Interval) 区间估计:指按预先给定的概率,计算出一个区间, 使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取 。 二、可信区间的计算 (一) 已知 (二) 未知 通常未知,这时可以用其估计量S 代替,但 已不再服从标准正态分布,而是服从著名的 t 分布。 可信区间的计算: 计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即 例4.2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32 g/L,标准差为0.57 g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。 例4.3 试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信区间为: 三、模拟实验 模拟抽样成年男子红细胞数。设定: 产生100个随机样本,分别计算其95%的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数 ,只有6个可信区间没有包含总体参数(用星号标记)。 第三节 假设检

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档