第六章虚拟变量回归模型(最新)摘要
第五章 简要总结:各模型的斜率值B2含义 线性回归模型:解释变量每变动一个单位,被解释变量变动的绝对量 双对数模型:解释变量每变动一个百分点,被解释变量变动的百分数 对数-线性模型:解释变量每变动一个单位,被解释变量均值的(瞬时)增长率 线性-对数模型:解释变量相对变动一个百分点,被解释变量变动的绝对量 倒数模型:解释变量的倒数每变动一个单位,被解释变量变动的绝对量 方差分析模型中参数的含义 E(Y|D=0)=B1+B2(0)=B1 E(Y|D=1)=B1+B2(1)=B1+B2 B1:企业男性职工的平均薪金, B2:企业女性职工的平均薪金与男性职工的差异,称为差别截距系数. B1+B2:企业女性职工的平均薪金 四、虚拟变量在季节分析中的应用 季节调整:把季节成分从一个时间序列中剔除的过程,称为消除季节成分或季节调整。 方法:虚拟变量法 得到季节调整的时间序列操作步骤: 1、根据引入虚拟变量的季节调整回归模型求得因变量的估计值 2、用y的实际值减去y的估计值,求得残差e 3、最后,用残差值e加上y均值,即得到经季节调整后的时间序列。 五、因变量是虚拟变量:线性概率模型 此处主要讨论作为因变量的虚拟变量是二分变量(或二元变量),即因变量只有两种情形,如,人的性别为“男”、“女” 考试分为“及格”、“不及格”,等等。 如教材中第149页, 举例:房子获得贷款与个人年收入模型 Y=B1+B2X+μ 其中,Y=1,表示申请到房贷;Y=0,表示没有申请到房贷 则斜率系数B2的含义: 自变量 变动一个单位,引起的y=1的概率的变化。 线性概率模型存在的问题 1、虽然因变量赋值为1或0,但无法保证其估计值介于0,1之间; 2、由于因变量是二分变量,则误差项也是二分变量,故只能假设随机项服从二项分布; 3、误差项是异方差的; 4、由于因变量赋值为1或0,所以判定系数R2没有实际意义。 总结 引入虚拟变量需要注意三点: 若回归模型中包含了截距项,则引入虚拟变量的个数必须比该虚拟变量的分类少一个(因为取值为0的已经设置为基准类,或比较类) 虚拟变量系数的解释与基准类有关 因为引入模型的虚拟变量有多个分类,必将消耗大量的自由度。 一个实际案例:虚拟变量回归分析 根据我国1998年城镇居民不同收入层次(8个层次)人均收入与彩电每百户拥有量统计资料回归结果如下: 其中:Y:彩电每百户拥有量,X为收入层次,D1=(1:中高收入家庭,0:低收入家庭) (资料来源:赵卫亚:计量经济学,上海财经大学出版社,P125) 样本数据回归结果 Dependent Variable: Y Method: Least Squares Date: 05/08/07 Time: 11:24 Sample: 1 8 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob. C 57.61132 3.545435 16.24944 0.0001 X 0.011852 0.001313 9.028053 0.0008 D1 31.87305 3.831027 8.319716 0.0011 XD -0.008754 0.001328 -6.593044 0.0027 R-squared 0.996374 Mean dependent var 102.6875 Adjusted R-squared 0.993654 S.D. dependent var 13.38747 S.E. of regression 1.066439 Akaike info criterion 3.273379 Sum squared resid 4.549164 Schwarz criterion 3.313100 Log likelihood -9.093516 F-statistic 366.3741 Durbin-Watson stat 2.292063 Prob(F-statistic) 0.000025 回归模型解释 低收入家庭: 高收入家庭: 由此可以看出,我国城镇居民家庭1998年彩电消费需求的特点: 对于低
原创力文档

文档评论(0)