正态分布区间估计.pptVIP

下载本文档

20
0
约2.59千字
约 29页
2023-05-18 发布于广东
举报

正态分布区间估计.ppt

第一页，共二十九页，2022年，8月28日抽样分布的特点各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律：围绕总体均数，中间多两边少，左右基本对称；样本均数的变异范围较之原变量的变异范围大大缩小；随着样本含量的增加，样本均数的变异范围逐渐缩小。第二页，共二十九页，2022年，8月28日由于总体中个体变异的存在，在抽样过程中产生的样本统计量与总体参数间的差异称为抽样误差。抽样误差第三页，共二十九页，2022年，8月28日标准误样本统计量的标准差称为标准误。样本均数的标准差称为样本均数的标准误，反映样本均数的离散程度，反映样本均数抽样误差大小。第四页，共二十九页，2022年，8月28日 t分布设从正态分布N(?,?2)中随机抽取含量为n的样本，设：实际工作中，总体方差未知，用样本方差代替，此时： ~ t分布， ? = n ? 1 第五页，共二十九页，2022年，8月28日单峰分布，曲线以0为中心，左右对称类似于标准正态分布。 t分布的形状与自由度?有关 t分布曲线第六页，共二十九页，2022年，8月28日 -tα/2,v tα/2,v 双侧：P(t≤-tα/2,ν)+ P(t≥tα/2,ν)=α P(-tα/2,ν t tα/2,ν) = 1-α 1-α 第七页，共二十九页，2022年，8月28日参数估计：由已知的样本统计量推断总体参数。参数估计：点估计和区间估计；区间估计：假设某个总体的均数为μ，需要找到两个数值A和B，使得在一个比较高的可信度下(如95%)，区间(A,B)能包含μ。即 P(AμB)=0.95 参数估计第八页，共二十九页，2022年，8月28日总体均数μ的区间估计由于总体情况未知，要计算总体参数μ的置信区间，必须依靠样本统计量进行推断。样本是从总体中抽样获得，因此不可避免存在抽样误差。因此计算总体参数的置信区间时，必须利用样本统计量，同时考虑抽样误差和可信的程度（1-α）。第九页，共二十九页，2022年，8月28日 σ未知且样本例数n较小时，按t分布原理计算 -ta/2,v ta/2,v a/2 a/2 第十页，共二十九页，2022年，8月28日 σ已知，按标准正态分布原理计算 -za/2 za/2 a/2 a/2 第十一页，共二十九页，2022年，8月28日 σ未知但样本例数n足够大（n＞50）时由t分布可知，自由度越大，t分布越逼近标准正态分布，按标准正态分布原理计算第十二页，共二十九页，2022年，8月28日 σ未知且样本例数n较小时，按t分布原理：总体均数的区间估计（单侧）第十三页，共二十九页，2022年，8月28日 σ已知，按标准正态分布原理计算： σ未知但样本例数n足够大（n＞50）时：总体均数的区间估计（单侧）第十四页，共二十九页，2022年，8月28日总体均数的可信区间(SAS实现) （1）t 分布法 SAS函数：TINV t=TINV(p,df) 求t分位数的函数，p是从-∞到当前t分位数位置的面积。 df=n-1（自由度）第十五页，共二十九页，2022年，8月28日例：随机抽取15名学生，记录他们的性别（sex）、年龄（age）、体重（w）和身高（h），求：学生身高的95%置信区间。 f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162 第十六页，共二十九页，2022年，8月28日 data a; input sex$ age w h @@; cards; f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 F 16 60 165 m 17 65 175 f 18 61 162 ；第十七页，共二十九页，2022年，8月28日 proc means; var h; Output out=b

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

正态分布区间估计.pptVIP