总体均数的估计与假设检验(第3章)课件.pptVIP

  • 2
  • 0
  • 约5.2千字
  • 约 88页
  • 2018-08-06 发布于贵州
  • 举报

总体均数的估计与假设检验(第3章)课件.ppt

总体均数的估计与假设检验(第3章)课件

计量资料的统计推断 总体均数的估计 与假设检验;均数的抽样误差与标准误 t 分布 总体均数的估计 t 检验 假设检验的注意事项;第一节 均数的抽样误差与标准误 ;了解总体特征的最好方法是对总体的每一 个体进行观察、试验,但这在医学研究实 际中往往不可行。 对无限总体不可能对所有个体逐一观察, 对有限总体限于人力、财力、物力、时间 或个体过多等原因,不可能也没必要对所 有个体逐一研究(如对一批罐头质量检查)。 借助抽样研究。 ;欲了解某地18岁男生身高值的平均水平, 随机抽取该地10名男生身高值作为样本。 由于个体变异与抽样的影响,抽得的样本 均数不太可能等于总体均数,造成样本统 计量与总体参数间的差异(表现为来自同一 总体的若干样本统计量间的差异),称为抽 样误差。 抽样误差是不可避免的。 抽样误差是有规律的。;1999年某市18岁男生身高值 Xi~N(μ, σ2) μ=167.7cm σ=5.3cm;样本均数抽样分布具有如下特点:;8;中心极限定理(central limit theorem) ;中心极限定理(central limit theorem);样本统计量的标准差称标准误 (standard error, SE) 样本均数的标准差称均数的标准误 (standard error of mean, SEM);标准差与标准误的区别;第二节 t 分布 ;1908年,英国统计学家 W.S.Gosset 以笔名“Student”在《Biometrics》杂志上发表论文,首次提出t分布概念,后人又称Student’s t-distribution,开创了小样本统计推断的新纪元,被认为是统计学发展史上的里程碑之一。;t 分布的概念;t分布的图形与特征 t分布为一簇单峰分布曲线,?不同,曲线 形状不同 t分布以0为中心,左右对称 t分布与?有关, ?越小, t值越分散,t分 布的峰部越低,而两侧尾部翘得越高 当?逼近?, 逼近 ,t分布逼近u分布; f(t);-t;t分布曲线下面积与横轴t值间关系(附表3);t0.05/2,9=2.262 ;-t;第三节 总体均数的估计 ;一、可信区间的概念;预先给定的概率(1??)称为可信度 (confidence level),常取95%或99%。;二、总体均数可信区间的计算;双侧;故该地18岁男生身高均数的 95%可信区间为(164.35, 169.55)cm。 μ=167.7cm 双尾;双侧;例 某地抽取正常成年人200名,测得其血清胆固醇均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。 ;三、可信区间的确切含义;来自N(0,1)的100个样本所计算的95%可信区间示意 ;正确性:可信度1??,即区间包含总体参数 的理论概率大小,愈接近1愈好。 精确性:区间的宽度,区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。 若只顾提高可信度,则可信区间会变宽。;四、可信区间与参考值范围的区别;第四节 t 检验 ;例 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?;1.进行检验假设 假设样本来自某一特定总体 2.确定检验水准 确定最大允许误差 3.选定检验方法计算检验统计量 计算样本与总体的偏离程度 4.计算与统计量对应的P值 5.作出结论 根据小概率反证法思想作出推断; t 检验(Student’s t-test) 设计 完全随机设计单样本 完全随机设计两样本 配对设计 要求 1.n较小(单组﹤60或两组合计﹤60) 2.样本随机地取自正态总体 3.两样本均数比较时所对应两总体 方差相等(homogeneity of variance);例 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?;2.计算检验统计量;-2.030;二、配对样本t 检验(paired t-test) ---变量为配对两组之差的d;42;1.建立检验假设,确定检验水准 H0:?d =0,两种方法的测定结果相同 H1:?d≠0, ?

文档评论(0)

1亿VIP精品文档

相关文档