医学统计学(李琳琳)2018-9 参数估计教学材料.pptVIP

  • 5
  • 0
  • 约2.75千字
  • 约 57页
  • 2018-12-06 发布于天津
  • 举报

医学统计学(李琳琳)2018-9 参数估计教学材料.ppt

医学统计学(李琳琳)2018-9 参数估计教学材料.ppt

参数估计;教 学 内 容;抽样研究与抽样误差 ; ; 从上边电脑模拟实验我们可以发现,我们抽样得到的100个样本均数各不相同,与总体均数74.5也不相同;此外,得到的100个标准差各不相同,与总体标准差5.6也不相同。 原因何在? 我们从总体中抽取一个样本含量为10的样本(即抽样研究),会产生误差(抽样误差)。 ;误差(error):指测量值和真值之间的差别。 抽样误差(sampling error):在抽样研究中,因抽样造成的样本统计量与样本统计量、样本统计量与总体参数的差别统称为抽样误差。 原因:个体变异 特征:A 不可避免性 B 可控性 ; ;图5-1 100个样本均数的频数分布图;以样本均数作为随机变量,有以下特点: (1)各样本均数未必等于总体均数。 (2)样本均数之间存在差异。 (3)样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称。 (4)样本均数的变异范围较之原变量的变异范围大大缩小。 ;数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。 样本均数的标准差(简称标准误,standard error, SE)是描述均数的抽样误差大小的指标。  ;标准误的理论值;【例5-1】随机抽取了60名成年男性,得到其脉搏均数为72次/分,标准差为5.8次/分,试计算其抽样误差。;中心极限定理;? = 50;;标准误的用途;标准误和标准差的区别与联系; t分布的概念 对于正态变量X ;抽出无数个样本含量为n的样本; 若σ未知,人们只能用S代替,从而以 代替 ,显然 ,它不再服从标准正态分布。 W.S.Gosett于1908年用笔名student研究了它的分布规律,称之为t分布。; ?=n-1;图2 不同自由度的t分布曲线 ;1. t分布是一簇曲线。 t分布有一个参数? 。 2. t分布曲线以0为中心,左右对称; ?越小,曲线越扁平。 3. t分布曲线较标准正态曲线要扁平些, ?逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若?=?,则t分布曲线和标准正态曲线完全吻合。 4. t分布曲线下的面积分布有一定规律(P380)。 ;生物医学研究的统计方法 第4章;;单侧概率的t 临界值,记作t(α,?);总体均数的参数估计;统计方法; 参数估计:用样本统计量来估计总体参数。 点值估计:不计抽样误差,直接用样本均数来估计μ。 区间估计:根据抽样误差的规律,按一定的概率估计总体均数的所在范围。统计上习惯用95%或99%可信区间表示总体均数可能所在范围。;样本统计量 (点估计);置信限与置信区间; 总体均数的95%置信区间表示的实际涵义是:如果从同一总体中重复抽取100份样本含量相同的独立样本,每份样本分别计算1个置信区间,在100个置信区间中,将大约有95个置信区间覆盖总体均数,5个置信区间不覆盖总体均数。; 通常情况下,我们只进行一次抽样,对于某一次估计的置信区间,我们总是宣称这个区间覆盖了总体均数,但不一定是真的覆盖了总体均数,于是,我们补充一句:置信水平为95%。 ;均值的抽样分布;;(一)正态分布法 适用条件:σ已知或σ未知但n较大时(n50);; [例] 在郑州市随机抽取了100名成年男性,测得其血清胆固醇含量为192.5mg/dl,标准差为28.6mg/dl,试估计郑州市成年男性血清胆固醇总体均数的95%置信区间。;(二)t分布法 适用条件:σ未知且n较小时(n ≤50 ); 【例5-3】已知某地25名成年女性腰围均数为77.8cm,标准差为9.2 cm,试计算该地成年女性腰围均数的95%和99%置信区间。 ;生物医学研究的统计方法 第4章;区别点 均数的置信区间 参考值范围 意义 包含总体均数的可 “正常人”的解剖、生理 能范围 生化指标的波动范围 计算公式 用途 估计总体均数 判断观察对象的某 项指标是否正常;率的抽样误差及区间估计;1率的抽样误差:从同一总体中随机抽取样本含量相同的若干个样本,各样本率之间不完全相同,这些样本率间的差异,同

文档评论(0)

1亿VIP精品文档

相关文档