stata回归结果详解
付畅俭
湘潭大学商学院
数据来源于贾俊平《统计学》(第7版),第12章多元线性回归
no
y
x1
x2
x3
x4
1
0.9
67.3
6.8
5
51.9
2
1.1
111.3
19.8
16
90.9
3
4.8
173
7.7
17
73.7
4
3.2
80.8
7.2
10
14.5
5
7.8
199.7
16.5
19
63.2
6
2.7
16.2
2.2
1
2.2
7
1.6
107.4
10.7
17
20.2
8
12.5
185.4
27.1
18
43.8
9
1
96.1
1.7
10
55.9
10
2.6
72.8
9.1
14
64.3
11
0.3
64.2
2.1
11
42.7
12
4
132.2
11.2
23
76.7
13
0.8
58.6
6
14
22.8
14
3.5
174.6
12.7
26
117.1
15
10.2
263.5
15.6
34
146.7
16
3
79.3
8.9
15
29.9
17
0.2
14.8
0.6
2
42.1
18
0.4
73.5
5.9
11
25.3
19
1
24.7
5
4
13.4
20
6.8
139.4
7.2
28
64.3
21
11.6
368.2
16.8
32
163.9
22
1.6
95.7
3.8
10
44.5
23
1.2
109.6
10.3
14
67.9
24
7.2
196.2
15.8
16
39.7
25
3.2
102.2
12
10
97.1
第三列df是自由度(degree of freedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=4,n=10,因此,dfr=4,dfe=n-m-1=20,dft=n-1=24。
第四列MS是均方差,误差平方和除以相应的自由度
1.第一行为回归均方差MSR
2.第二行为剩余均方差MSE,数值越小拟合效果越好
1.方差分析
F值,用于线性关系的判定。
结合P值对线性关系的显著性进行判断,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率,P值越小越好。对于本例,P=0.00000.0001,故置信度达到99.99%以上。
R- Squared为判定系数(determination coefficient),或称拟合优度(goodness of fit),它是相关系数的平方,也是SSR/SST,y的总偏差中自变量解释的部分。
Adjusted对应的是校正的判定系数
Root MSE为标准误差(standard error),数值越小,拟合的效果越好
2.模型显著性
回归系数
回归系数标准误差
T值
T值=Coef./Std. Err.
P值
置信区间
置信区间(CI)
0.0145294-invttail(20,0.025)*0.0830332=0.0145294-2.086*0.0830332=-0.1586748
0.0145294+2.086*0.0830332=0.1877335
3.回归系数检验
P值用于说明回归系数的显著性,一般来说P值0.1(*)表示10%显著水平显著,P值0.05(**)表示5%显著水平显著, P值0.01(***)表示1%显著水平显著
4.系数标准误差计算
当自变量只有两个时,R2j就是这两个变量的相关系数(pwcorr x2 x1)的平方
对多元回归“排除其它变量影响”的解释
简单回归和多元回归估计值的比较
tw (function t=tden(20,x),range(-3 3)), xline(0.17 2.086)
ttail(df,t) = p 计算单边P值
双边时P值加倍就行了
如: ttail(20,0.17498)*2=0.863
invttail(df,p) = t 计算单边临界值
在双边95%置信度,5%显著水平时的临界值为:
t0=invttail(20,0.025)=2.086
2.086
0.17
t0
t
0.0145294-invttail(20,0.025)*0.0830332=0.0145294-2.086*0.0830332=-0.1586748
0.0145294+2.086*0.0830332=0.1877335
5.系数置信区间
Stata中查临界值和p值
normalden(z)
normal(z) invnormal(p)
原创力文档

文档评论(0)