正态分布区间估计.pptVIP

  • 20
  • 0
  • 约2.59千字
  • 约 29页
  • 2023-05-18 发布于广东
  • 举报
第一页,共二十九页,2022年,8月28日 抽样分布的特点 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律:围绕总体均数,中间多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小;随着样本含量的增加,样本均数的变异范围逐渐缩小。 第二页,共二十九页,2022年,8月28日 由于总体中个体变异的存在,在抽样过程中产生的样本统计量与总体参数间的差异称为抽样误差。 抽样误差 第三页,共二十九页,2022年,8月28日 标准误 样本统计量的标准差称为标准误。 样本均数的标准差称为样本均数的标准误,反映样本均数的离散程度,反映样本均数抽样误差大小。 第四页,共二十九页,2022年,8月28日 t分布 设从正态分布N(?,?2)中随机抽取含量为n的样本,设: 实际工作中,总体方差未知,用样本方差代替,此时: ~ t分布, ? = n ? 1 第五页,共二十九页,2022年,8月28日 单峰分布,曲线以0为中心,左右对称类似于标准正态分布。 t分布的形状与自由度?有关 t分布曲线 第六页,共二十九页,2022年,8月28日 -tα/2,v tα/2,v 双侧:P(t≤-tα/2,ν)+ P(t≥tα/2,ν)=α P(-tα/2,ν t tα/2,ν) = 1-α 1-α 第七页,共二十九页,2022年,8月28日 参数估计:由已知的样本统计量推断总体参数。 参数估计:点估计和区间估计; 区间估计: 假设某个总体的均数为μ,需要找到两个数值A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含μ。即 P(AμB)=0.95 参数估计 第八页,共二十九页,2022年,8月28日 总体均数μ的区间估计 由于总体情况未知,要计算总体参数μ的置信区间,必须依靠样本统计量进行推断。 样本是从总体中抽样获得,因此不可避免存在抽样误差。 因此计算总体参数的置信区间时,必须利用样本统计量,同时考虑抽样误差和可信的程度(1-α)。 第九页,共二十九页,2022年,8月28日 σ未知且样本例数n较小时,按t分布原理计算 -ta/2,v ta/2,v a/2 a/2 第十页,共二十九页,2022年,8月28日 σ已知,按标准正态分布原理计算 -za/2 za/2 a/2 a/2 第十一页,共二十九页,2022年,8月28日 σ未知但样本例数n足够大(n>50)时 由t分布可知,自由度越大,t分布越逼近标准正态分布,按标准正态分布原理计算 第十二页,共二十九页,2022年,8月28日 σ未知且样本例数n较小时,按t分布原理: 总体均数的区间估计(单侧) 第十三页,共二十九页,2022年,8月28日 σ已知,按标准正态分布原理计算: σ未知但样本例数n足够大(n>50)时: 总体均数的区间估计(单侧) 第十四页,共二十九页,2022年,8月28日 总体均数的可信区间(SAS实现) (1)t 分布法 SAS函数:TINV t=TINV(p,df) 求t分位数的函数,p是从-∞到当前t分位数位置的面积。 df=n-1(自由度) 第十五页,共二十九页,2022年,8月28日 例:随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w)和身高(h),求:学生身高的95%置信区间。 f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 f 16 60 165 m 17 65 175 f 18 61 162 第十六页,共二十九页,2022年,8月28日 data a; input sex$ age w h @@; cards; f 15 46 156 f 14 41 149 f 18 65 165 m 15 50 160 m 13 48 155 m 18 70 180 m 14 38 150 m 16 55 165 m 17 68 176 m 16 60 170 f 17 50 160 f 17 58 160 F 16 60 165 m 17 65 175 f 18 61 162 ; 第十七页,共二十九页,2022年,8月28日 proc means; var h; Output out=b

文档评论(0)

1亿VIP精品文档

相关文档