- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用标准文案
精彩文档
第6章 多元回归分析: 进一步的专题
摘要: 本章进一步讨论若干多元回归分析问题,对实证分析很有帮助。
6.1 OLS统计量的数据缩放效应
在C2中简单讨论了变量的单位变化对回归参数和R2值的影响。由于R2值实际上是y的拟合值和实际值相关系数的平方,所以其不会受数据缩放的影响。类似地,可以预期变量单位改变对回归参数及其标准误、回归标准误、置信区间、t统计量、F统计量的影响。见如下的例子: 第二列改变了因变量的单位,从原来的盎司改为镑(数据缩小16倍);第三列改变
Beta系数
在某些实证分析中,自变量的现实意义是很难解释的,例如,在劳动经济学中,经常收集一些得分数据,这些数据变量的分数设置是很任意的,从而解释起来比较困难。此外,我们有时也希望了解不同类型的自变量在模型中的重要程度。此时,对因变量和自变量进行标准化后,再进行回归建模,可能是一个不错的选择。也就是,我们可以讨论自变量增加或减少一个标准差后给因变量带来的影响。
有如下的OLS回归方程:
yi
用它们的平均方程去减它们:
yi
标准化后得到 :
yi
或者改写成称:
zy
上述的Z变量分别被称为y和各个自变量的z-得分。
问:哪些重要的统计量不会被改变?
6.2 函数形式的再讨论
对数函数形式
讨论如下的回归方程:
log?
在该问题中由于rooms的变化单位是1,这是自变量的很大变化。在固定nox的前提下,100 β2 =100*.306来近似%?
%?
在此例子中,当增加1个房间时,%?y=35.8%
对变量取对数的优点:1)正态化y(对称化,减小厚尾和异方差现象),使其更容易满足CLM;2)减小异常值的影响。
含二次函数(Quadratic functions)的模型
二次函数可用于对单增或单减的边际效应的建模。若回归方程为:
y=
?y≈(β
带交叉项的模型(Models with interaction terms)
price=
请解释上述回归方程中交叉项所表示的含义?
我们更倾向于在均值(中值)、上四分位数或下四分位数处讨论模型。因此,对回归模型:
Stndfnl=2.05-.0067atndrte-1.63priGPA-1.28ACT+.296priGPA2+.0045 ACT2+.0056priGPA.atndrte
(1.36) (.0102) (.48) (.098) (.101) (.0022) (.0043)
N=680,R-方=.229,修正R-方等于=.222; 讨论priGPA的均值2.59处的偏效应,则有
?Stndfnl≈{-.0067+.0056*2.59+.0056(priGPA-2.59)}. ?atndrte={.0078+.0056(priGPA-2.59)}.
请检验.0078是否统计显著?
6.3 修正R-方
R2=1-SSR/nSST/n,由此可以定义总体R2(
几点说明: 1) R2仍然不是总体p2一个无偏估计;2)它在变元个数和SSR之间做了一个适当的权衡;3)一个新变量进入模型当且仅当其t值大于一个单位;一组新变量进入模型当且仅当其联合显著性的F值大于一个单位;4)
应用修正R2
非嵌套模型(nonnested models)是指任意一个模型并不是其它模型的特例。有时变量间的共线性会使得本来显著的变量变成不显著,那么我们只能互斥性地选择其中的部分变量。此时,修正R-方比起R-方和F统计量都较优。但要注意,修正R-方只能在因变量都相同的非嵌套模型间做出选择。
在回归分析中控制了太多因素
有时引入一个变量难以让人理解,或者根本就控制不住,这些变量就不应该被引入。记住一句话,不同的模型服务于不同的目的。
加入回归元来减少标准误
如果一个自变量和其它自变量不相关,那么引入它通常可以减少回归标准误。
6.4 预测和残差分析
预测(Predictions)受限于抽样方差,本节讨论因变量预测的置信区间。残差分析也能提供额外的信息。
预测的置信区间(Confidence Intervals for Predictions)
有关于被预测变量某点取值的总体方程:
θ0
其样本方程为:
θ0
如何得到该点的置信区间?方法是将被预测变量某点取值的总体方程代入总体模型,消去β0得
y=θ
然后估计即可。
上述方法可以得到均值方程的区间估计。对于某个样本值y0,其置信区间(预测区间,prediction interval
y0=β
由于θ0和u0相互独立和预测误差(prediction error
u0
从而,Varu0=Var
从而有u0的标准误: se(u0)=σ2+Var
残差分析(residual analysis)
文档评论(0)