- 2
- 0
- 约5.2千字
- 约 88页
- 2018-08-06 发布于贵州
- 举报
总体均数的估计与假设检验(第3章)课件
计量资料的统计推断 总体均数的估计与假设检验;均数的抽样误差与标准误
t 分布
总体均数的估计
t 检验
假设检验的注意事项;第一节
均数的抽样误差与标准误
;了解总体特征的最好方法是对总体的每一
个体进行观察、试验,但这在医学研究实
际中往往不可行。
对无限总体不可能对所有个体逐一观察,
对有限总体限于人力、财力、物力、时间
或个体过多等原因,不可能也没必要对所
有个体逐一研究(如对一批罐头质量检查)。
借助抽样研究。 ;欲了解某地18岁男生身高值的平均水平,
随机抽取该地10名男生身高值作为样本。
由于个体变异与抽样的影响,抽得的样本
均数不太可能等于总体均数,造成样本统
计量与总体参数间的差异(表现为来自同一
总体的若干样本统计量间的差异),称为抽
样误差。
抽样误差是不可避免的。
抽样误差是有规律的。;1999年某市18岁男生身高值
Xi~N(μ, σ2)
μ=167.7cm
σ=5.3cm;样本均数抽样分布具有如下特点:;8;中心极限定理(central limit theorem) ;中心极限定理(central limit theorem);样本统计量的标准差称标准误
(standard error, SE)
样本均数的标准差称均数的标准误
(standard error of mean, SEM);标准差与标准误的区别;第二节
t 分布
;1908年,英国统计学家 W.S.Gosset 以笔名“Student”在《Biometrics》杂志上发表论文,首次提出t分布概念,后人又称Student’s t-distribution,开创了小样本统计推断的新纪元,被认为是统计学发展史上的里程碑之一。;t 分布的概念;t分布的图形与特征
t分布为一簇单峰分布曲线,?不同,曲线
形状不同
t分布以0为中心,左右对称
t分布与?有关, ?越小, t值越分散,t分
布的峰部越低,而两侧尾部翘得越高
当?逼近?, 逼近 ,t分布逼近u分布; f(t);-t;t分布曲线下面积与横轴t值间关系(附表3);t0.05/2,9=2.262 ;-t;第三节
总体均数的估计
;一、可信区间的概念;预先给定的概率(1??)称为可信度
(confidence level),常取95%或99%。;二、总体均数可信区间的计算;双侧;故该地18岁男生身高均数的
95%可信区间为(164.35, 169.55)cm。
μ=167.7cm 双尾;双侧;例 某地抽取正常成年人200名,测得其血清胆固醇均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数95%可信区间。 ;三、可信区间的确切含义;来自N(0,1)的100个样本所计算的95%可信区间示意 ;正确性:可信度1??,即区间包含总体参数
的理论概率大小,愈接近1愈好。
精确性:区间的宽度,区间愈窄愈好。
当样本含量为定值时,上述两者互相矛盾。
若只顾提高可信度,则可信区间会变宽。;四、可信区间与参考值范围的区别;第四节
t 检验
;例 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?;1.进行检验假设
假设样本来自某一特定总体
2.确定检验水准
确定最大允许误差
3.选定检验方法计算检验统计量
计算样本与总体的偏离程度
4.计算与统计量对应的P值
5.作出结论
根据小概率反证法思想作出推断; t 检验(Student’s t-test)
设计 完全随机设计单样本
完全随机设计两样本
配对设计
要求 1.n较小(单组﹤60或两组合计﹤60)
2.样本随机地取自正态总体
3.两样本均数比较时所对应两总体
方差相等(homogeneity of variance);例 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?;2.计算检验统计量;-2.030;二、配对样本t 检验(paired t-test)
---变量为配对两组之差的d;42;1.建立检验假设,确定检验水准
H0:?d =0,两种方法的测定结果相同
H1:?d≠0,
?
原创力文档

文档评论(0)