网站大量收购独家精品文档,联系QQ:2885784924

计量经济与学 多元线性回归 .ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量经济与学 多元线性回归

* 拟合优度(续) 我们怎样衡量我们的样本回归线拟合样本数据有多好呢? 可以计算总平方和(SST)中被模型解释的部分,称此为回归R2 R2 = SSE/SST = 1 – SSR/SST * 更多关于R2 当回归中加入另外的解释变量时,R2通常会上升。 如果OLS使此解释变量取任何非零系数,那么加入此变量之后,SSR降低了。 实际操作中,被估计系数精确取零是极其罕见的,所以,当加入一个新解释变量后,一般来说,SSR会降低。 * 调整过的R2(The Adjusted R-squared) 因此, R2增加并不意味着加入新的变量一定会提高模型拟合度。 调整过的R2是R2一个修正版本,当加入新的解释变量,调整过的R2不一定增加。 * 调整过的R2 调整过的R2是1减去OLS残差的样本方差(修正过自由度之后)与y的样本方差之比。 调整过的R2的三个有用性质: 因为(n-1)/(n-k-1)1 ,所以调整过的R2总比R2小。 加入一个解释变量有两个相反的效果。(1)SSR降低导致调整过的R2增加。(2) (n-1)/(n-k-1) 增加导致调整过的R2降低。 调整过的R2可能是负的,发生在以下情况:所有解释变量使残差平方和下降的太少,不足以抵消因子(n-1)/(n-k-1)。 R2只有在过原点回归中才可能为负。 * 比较R2和Adjusted R2 R2和调整过的R2告诉我们,解释变量是否很好地预测了,或“解释”了,手头数据中被解释变量的值。 R2和调整过的R2并没有告诉我们 被包含变量是否统计显著 解释变量是否是被解释变量变动的真正原因 是否有遗漏变量偏误,或 是否选取了最合适的解释变量组合 * R2和Adjusted R2 在决定某个变量是否应该被加入模型时,R2和Adjusted R2并非理想的工具。 决定一个解释变量是否属于模型的因素应该是,该解释变量在总体中对y的局部效应是否为零。 * 拟合优度和解释变量选择的进一步探讨 Adjusted R-Squared * 我们定义总体R2为:y的变异在总体中能被解释变量解释的比例,为 调整过的R2仍不是总体R2的一个无偏估计量,因为两个无偏估计量的比例不是一个无偏估计量。 拟合优度和解释变量选择的进一步探讨 * 调整过的R2最根本的吸引力,在于它对向模型增加自变量的惩罚。 如果我们向回归模型加入一个新的解释变量,当且仅当新变量的t统计量的绝对值大于1时,调整过的R2增加。 拟合优度和解释变量选择的进一步探讨 * 利用调整的R2在两个非嵌套模型中进行选择 如果两个模型中任何一个都不是另一个的特例,则两个模型是非嵌套的。 F统计量只允许我们检验嵌套的模型,因为有限制的模型是无限制模型的特例。 我们需要一些在无嵌套模型间进行选择的指导。 * 当变量有不同函数形式时,通过比较调整过的R2 ,在不同的解释变量的非嵌套组合中进行选择,是颇有价值的。 例如,一个模型是y= b0 + b1x1 + b2log(x2 ) , 另一个是y= b0 + b1x1 +b2 x2+b3 x22 。 如果第一个模型调整过的R平方为0.3,而第二个为0.6,我们倾向于选择第二个模型 利用调整的R2在两个非嵌套模型中进行选择 * 调整过的R2的限制:我们不能利用它在关于因变量函数形式不同的模型间进行选择 利用调整的R2在两个非嵌套模型中进行选择 * 预测分析:估计量 * 预测分析:标准差 * 预测分析:置信区间 * 预测分析:一个特殊y的置信区间 * 预测分析: y0的预测区间 * 预测分析: y0的预测区间 * 有时,检验个体观测值来看它的因变量高于还是低于预测值是有用的。 也就是,检验个体观测值的残差。 残差分析 * 残差分析 例:将房价对一些可观测特点回归,得预测值,算出残差。残差为负则说明根据可观测因素房价偏低。负的程度最大值的大小说明我们还没有控制因素的重要程度。可为改值建立预测区间。 * y = b0 + b1x1 + b2x2 + . . . bkxk + u 5. Dummy Variables * 虚拟变量 虚拟变量是一个取值为1或0的变量。 例: male (= 1 if are male, 0 otherwise), south (= 1 if in the south, 0 otherwise), etc. 虚变量也称二值变量。 * 虚拟变量 考虑只有一个解释变量(x)和一个虚拟变量(d)的简单模型。 y = b0 + d0d + b1x + u 该模型可以看做是一个截距的变化。This can be interpreted as an intercept shift 若d = 0, 则 y = b0

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档