- 3
- 0
- 约 53页
- 2017-08-16 发布于江西
- 举报
sas讲稿第3章.doc
SAS软件与应用统计
第三章 置信估计与假设检验
3.1 置信区间
3.1.1 概述
1. 点估计
用样本的统计量估计总体的某数字特征或参数称为点估计。如:用估计(,S估计,即样本均值估计总体均值,样本方差估计总体方差。
注意到,样本是具有随机性的,不同的样本产生总体均值的不同的估计值,这些估计值间的差异就是总体均值估计量的差异,所以不能把样本均值作为总体均值绝对精确的估计,而是需要总体均值的置信区间来估计总体均值。我们把具有一定可靠性和精度的估计称为置信估计。
2. 中心极限定理(Control Limit Theoren)
中心极限定理,对几乎任何总体的独立随机样本,当样本容量足够大时:
● 样本均值的分布接近于正态分布;
● 样本均值接近于总体均值。
3. 正态分布
正态分布描述落入不同范围的概率。近似地有
● 68%的数据落入均值为中心一倍标准差的范围内;
● 95%的数据落入均值为中心两倍标准差的范围内;
● 99%的数据落入均值为中心三倍标准差的范围内。
4. 置信区间
(1) 一般地,对于总体的未知参数?,其置信区间(a, b)是指由统计量a,b确定的区间,它满足P(a ? b) = 1 – α。
其中的1 – α称为置信水平。a,b分别称为置信下限和置信上限。上式的含义是以1 – α的概率保证?在(a, b)中取值。
(2) 正态分布总体方差已知时,使用z值法,均值的置信水平为1 – α的置信区间为:;
正态分布总体方差未知时,使用t值法,均值的置信水平为1 – α的置信区间为:。
说明:
由于总体方差不易求出,所以大多使用t值法,SAS中的置信区间也是使用此法求出。
(3) 置信区间的长度取决于置信水平、数据的波动和样本容量:
● 置信水平越高,置信区间长度越大;
● 样本方差越大,置信区间长度越大;
● 在相同的置信水平和方差的情况下,增加样本的容量可以减少置信区间的长度。
选择置信水平和样本容量使置信区间有实用价值是重要的,一个很高的置信水平和很小的样本容量可使置信区间长得毫无实用价值。
3.1.2 INSIGHT作均值、标准差、方差的置信区间
在SAS/INSIGHT中提供了计算正态总体均值的置信区间的功能。下面举例说明如何从数据集SASUSER.CLASS得到变量HEIGHT的置信水平为95%的置信区间:
(1) 首先启动SAS/INSIGHT,并打开数据集SASUSER.CLASS。
图3-1 95%Confidence Interval
(2) 选择菜单“Analyze(分析)”→“Distribution(Y)(拟合分布)”;
(3) 在打开的
“Distribution(Y)”对话框中选定分析变量:选择变量HEIGHT,单击“Y”按钮,将变量移到右上方的列表框中;
(4) 单击“Output”按钮,在打开的对话框中选中,“Basic Confidence interval”复选框;
(5) 两次单击“OK”按钮,得到变量的分析结果;其中包括一个名为“95%Confidence Interval”的列表,表中给出了均值、标准差、方差的估计量以及置信下限和置信上限。如图3-1所示。
若要得到其它置信水平的置信区间,例如要97.5%的置信区间,可以选择菜单“Tables”→“Basic Confidence Interval”→“Others”,在打开的“Basic Confidence Interval”对话框中修改置信水平,如图3-2所示。
图3-2 97.5%置信水平
可以看到,由于置信水平的提高,置信区间的长度在增加。
3.1.3 用分析员应用作置信区间
在分析员应用中,置信估计是假设检验功能的一部分。因此,要得到某一参数的置信区间,需要从关于这参数的检验菜单进入。下面说明如何从数据集SASUSER.CLASS得到变量HEIGHT的置信区间:
首先在“分析员应用”中打开数据集SASUSER.CLASS。
1. 均值的置信区间
(1) 选择菜单“Statistics(统计)”→“Hypothesis Tests(假设检验)”→“One Sample t – test for a Mean(单样本均值T检验)”;
(2) 在打开的“One Sample t – test for a Mean”对话框中选择变量“HEIGHT”,单击“Variable”,将其移到“Variable”中,如图3-3左所示;
图3-3 设置均值的置信区间
原创力文档

文档评论(0)