抽样误差与假设检验.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

关于抽样误差与假设检验第一节均数的抽样误差与标准误一、均数的抽样误差在医学研究中,绝大多数情况是由样本信息研究总体。由于个体存在差异,因此通过样本推论总体时会存在一定的误差,如样本均数往往不等于总体均数,这种由抽样造成的样本均数与总体均数的差异称为抽样误差。对于抽样研究,抽样误差不可避免。第2页,共24页,2024年2月25日,星期天二、抽样误差的分布理论上可以证明:若从正态总体中,反复多次随机抽取样本含量固定为n的样本,那么这些样本均数也服从正态分布,即的总体均数仍为,样本均数的标准差为。抽样分布抽样分布示意图第3页,共24页,2024年2月25日,星期天中心极限定理:当样本含量很大的情况下,无论原始测量变量服从什么分布,的抽样分布均近似正态。抽样分布抽样分布示意图第4页,共24页,2024年2月25日,星期天三、标准误(StandardError)样本均数的标准差称为标准误。样本均数的变异越小说明估计越精确,因此可以用标准误表示抽样误差的大小:实际中总体标准差往往未知,故只能求得样本均数标准误的估计值:第5页,共24页,2024年2月25日,星期天例4.1在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38×1012/L,试计算均数的标准误。标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。第6页,共24页,2024年2月25日,星期天第二节总体均数的估计一、可信区间的概念(ConfidenceInterval)区间估计:指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率称为可信度,通常取。参数估计点估计:不考虑抽样误差,如区间估计:考虑抽样误差第7页,共24页,2024年2月25日,星期天二、可信区间的计算(一)已知一般情况其中为标准正态分布的双侧界值。可信区间:第8页,共24页,2024年2月25日,星期天标准正态分布(二)未知通常未知,这时可以用其估计量S代替,但已不再服从标准正态分布,而是服从著名的t分布。图4-2不同自由度的t分布图第9页,共24页,2024年2月25日,星期天可信区间的计算:计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即可信区间:需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。在大样本情况下(如n100),也可以用替换近似计算。第10页,共24页,2024年2月25日,星期天例4.2某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32g/L,标准差为0.57g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。下限:上限:第11页,共24页,2024年2月25日,星期天例4.3试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。本例属于大样本,可采用正态近似的方法计算可信区间。因为,则95%可信区间为:下限:上限:第12页,共24页,2024年2月25日,星期天三、模拟实验模拟抽样成年男子红细胞数。设定:产生100个随机样本,分别计算其95%的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数,只有6个可信区间没有包含总体参数(用星号标记)。第13页,共24页,2024年2月25日,星期天图4-2模拟抽样成年男子红细胞数100次的95%可信区间示意图******第14页,共24页,2024年2月25日,星期天第三节假设检验的意义和步骤(HypothesisTest)统计推断的另一个重要内容,目的是通过样本数据

文档评论(0)

努力奋斗的小玲 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档