stata回归结果详解.ppt

stata回归结果详解 付畅俭 湘潭大学商学院 数据来源于贾俊平《统计学》(第7版),第12章多元线性回归 no y x1 x2 x3 x4 1 0.9 67.3 6.8 5 51.9 2 1.1 111.3 19.8 16 90.9 3 4.8 173 7.7 17 73.7 4 3.2 80.8 7.2 10 14.5 5 7.8 199.7 16.5 19 63.2 6 2.7 16.2 2.2 1 2.2 7 1.6 107.4 10.7 17 20.2 8 12.5 185.4 27.1 18 43.8 9 1 96.1 1.7 10 55.9 10 2.6 72.8 9.1 14 64.3 11 0.3 64.2 2.1 11 42.7 12 4 132.2 11.2 23 76.7 13 0.8 58.6 6 14 22.8 14 3.5 174.6 12.7 26 117.1 15 10.2 263.5 15.6 34 146.7 16 3 79.3 8.9 15 29.9 17 0.2 14.8 0.6 2 42.1 18 0.4 73.5 5.9 11 25.3 19 1 24.7 5 4 13.4 20 6.8 139.4 7.2 28 64.3 21 11.6 368.2 16.8 32 163.9 22 1.6 95.7 3.8 10 44.5 23 1.2 109.6 10.3 14 67.9 24 7.2 196.2 15.8 16 39.7 25 3.2 102.2 12 10 97.1 第三列df是自由度(degree of freedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=4,n=10,因此,dfr=4,dfe=n-m-1=20,dft=n-1=24。 第四列MS是均方差,误差平方和除以相应的自由度 1.第一行为回归均方差MSR 2.第二行为剩余均方差MSE,数值越小拟合效果越好 1.方差分析 F值,用于线性关系的判定。 结合P值对线性关系的显著性进行判断,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率,P值越小越好。对于本例,P=0.00000.0001,故置信度达到99.99%以上。 R- Squared为判定系数(determination coefficient),或称拟合优度(goodness of fit),它是相关系数的平方,也是SSR/SST,y的总偏差中自变量解释的部分。 Adjusted对应的是校正的判定系数 Root MSE为标准误差(standard error),数值越小,拟合的效果越好 2.模型显著性 回归系数 回归系数标准误差 T值 T值=Coef./Std. Err. P值 置信区间 置信区间(CI) 0.0145294-invttail(20,0.025)*0.0830332=0.0145294-2.086*0.0830332=-0.1586748 0.0145294+2.086*0.0830332=0.1877335 3.回归系数检验 P值用于说明回归系数的显著性,一般来说P值0.1(*)表示10%显著水平显著,P值0.05(**)表示5%显著水平显著, P值0.01(***)表示1%显著水平显著 4.系数标准误差计算 当自变量只有两个时,R2j就是这两个变量的相关系数(pwcorr x2 x1)的平方 对多元回归“排除其它变量影响”的解释 简单回归和多元回归估计值的比较 tw (function t=tden(20,x),range(-3 3)), xline(0.17 2.086) ttail(df,t) = p 计算单边P值 双边时P值加倍就行了 如: ttail(20,0.17498)*2=0.863 invttail(df,p) = t 计算单边临界值 在双边95%置信度,5%显著水平时的临界值为: t0=invttail(20,0.025)=2.086 2.086 0.17 t0 t 0.0145294-invttail(20,0.025)*0.0830332=0.0145294-2.086*0.0830332=-0.1586748 0.0145294+2.086*0.0830332=0.1877335 5.系数置信区间 Stata中查临界值和p值 normalden(z) normal(z) invnormal(p)

文档评论(0)

1亿VIP精品文档

相关文档