医学统计学-参数估计与假设检验 PPT.pptx

医学统计学-参数估计与假设检验 PPT.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共80页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;第一节参数估计;抽样误差和抽样分布

样本均数的抽样分布和抽样误差

样本频率的抽样分布和抽样误差

点估计和可信区间

总体均数、总体率的点估计

总体均数、总体率的可信区间;总体(population):调查研究的事物或现象的全体

个体(itemunit):组成总体的每个元素

样本(sample):从总体中所抽取的部分个体

样本容量(samplesize):样本中所含个体的数量;我们想研究某年某地区10万名13岁?孩的身?情况。

直接法:调查这10万名?孩,测量她们的身?,然后进?统计分析。

随机抽样:如随机抽样调查200个?童,测量她们的身?,通过分析这200个?童的身?来推断该地区10万名13岁?孩的身?情况。;总体:该地区10万名13岁?孩身?观察值的全体

个体:每个13岁?孩的身?观察值

样本:随机抽样所得200名13岁?孩的身?观察值

样本容量:200

抽样实验:通过样本信息了解总体的情况。即通过分析200名13岁?孩身?来估计10万名13岁?孩的身?情况。也就是用样本均数去估计总体均数。;误差泛指实测值和真实值之差。按其产?原因与性质可分为:系统误差和随机误差。

系统误差

由受试对象、研究者、仪器设备、研究?法等确定性原因造成,有倾向性,可避免。

随机误差

由多种?法控制的偶然因素引起的。?倾向性,不可避免。;抽样误差

由于?物固有的个体变异,从某?总体中随机抽取?个样本,所得样本统计量与相应总体参数往往是有差异的,这种差异称为抽样误差(samplingerror)。

抽样误差是?种随机误差

抽样误差产?的根本原因是个体变异,产?的直接原因是抽样。;由于抽样误差存在,从同?总体中随机抽取若?份样本,所得样本统计量是不?致的,差异?法避免但其存在?定的分布规律。;样本均数抽样分布和抽样误差;【例6-1】假定某年某地所有13岁??的身?服从总体均数为155.4cm,总体标准差为5.3cm的正态分布。用计算机从该总体中随机抽样,每次抽取5例组成

?份样本,重复抽样100次,计算每份样本的平均身?。;正态分布总体样本均数的抽样分布;正态分布总体样本均数的抽样分布;正态分布总体的样本均数抽样分布具有以下特点:

样本均数恰好???于总体均数极其罕见;

样本均数围绕总体参数,中间多,两边少,左右基本对称,呈正态分布;

样本均数之间存在差异;

样本均数的变异小于原始变量值间的变异;用计算机从正偏态分布的总体中随机抽取样本量为5、10、30和50的样本各1000份,计算样本均数并绘制4个直方图。;非正态分布总体样本均数的抽样分布

Histogramofy1 Histogramofy2;中心极限定理;均数抽样误差;样本均数的标准差;样本均数的标准差;样本均数的标准差;样本均数的标准差;【例6-2】2000年某研究所随机调查某地健康成年男

?27?。得到?红蛋白量的样本均数为125g/L,标准差为15g/L。试估计该样本均数的抽样误差。;;T分布的概念;T分布的概念;T分布曲线的特点;T分布曲线的特点;T分布;T分布;抽样分布和抽样误差

样本统计量抽样分布

误差含义及误差产?的原因

样本均数抽样分布和抽样误差

正态分布总体样本均数抽样分布规律

非正态分布总体样本均数抽样分布规律

均值标准误的含义和计算

t分布;参数估计;点估计

用样本统计量直接来估计总体参数的值。;用样本统计量直接来估计总体参数的值。

【例6-4】2000年某研究所测到某地27例健康成年男性?红蛋白量的样本均数为125g/L,试估计其总体均数。

??? →??

即认为2000年该地区所有健康成年男性?红蛋白量的总体均数为125g/L。;在区间估计中,预先给定的概率(1-??),称为可信度(confidencelevel),常取95%或者99%。

通过可信度,计算得到的区间范围,称为可信区间(confidenceinterval,CI).

可信区间有两个数值界定的可信限构成。较小的数值

为下线(lowerlimit,L),交?数值为上限(upperlimit,U),

?般表示为(L,U).;95%可信区间的含义:

从总体中随机抽样,做100次抽样,每个样本可算的

?个可信区间,得到100个可信区间。平均有95个可信区间包括??(估计正确),只有5个可信区间不包括

??(估计错误)。;??已知

按照标准正态分布原理计算,由??分布,标准正态曲线下有95%的??值在±1.96之间。;??未知,但样本例数?够?(n50)时

由??分布可知,自由的越?,??分布越逼近正态分布,此时??曲线下有95%的??值在±1.96之间。;??未知,但样本例数较小时

由??分布原理可知,此时某自由度的?

文档评论(0)

ning2021 + 关注
实名认证
内容提供者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档