网站大量收购独家精品文档,联系QQ:2885784924

第3章 多元(复)回归分析PPT.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 多元(复)回归分析PPT

第三章 多元(复)回归分析;1. 复回归分析:估计问题;其中(6)是说X2与X3之间没有精确的线性关系,专业上称为无共线性或无多重共线性。无共线性是说没有一个解释变量可以写成其余解释变量的线性组合。如果不存在一组不全为零的数λ2和λ3,使得: 如果是这关系存在,我们就说, X2与X3的共线的或线性相关。令一方面,如果这一关系仅当λ2=λ3=0时存在,则X2与X3线性独立。;(a)图表示X2和X3不存在线性关系。(b)图中,区域Y的3和4区域的变异是由于X2引起的,而Y的4和5区域的变异是由于X3引起的,但是区域4是X2和X3共有的,我们无法精确地区别开来,这样区域4代表了共线性。无共线性就要求像(a)图那样,解释变量没有重叠区域。;1.2 对复回归方程的解释 对式子两边求条件期望: 这样,式子给出以变量X2和X3的固定值为条件的Y的条件均值或期望值。如同双变量回归分析,复回归分析是以多个解释变量的固定值为条件的回归分析,并且我们所获取的,是变量X值固定时的Y的平均值或Y的平均响应。;1.4 偏回归系数的OLS估计 先写出样本回归函数(SRF): OLS方法是要选择未知参数的值,使得残差平方和尽可能的小,用符号表示为: 对未知数求微分,并令表达式为零,得到下述正则方程:;按照用小写字母表示对样本离差的惯例,解正则方程得: β2和β3最小二乘估计量的性质: (1)可以从方程2和方程3中通过x2和x3的对调得到另外一个,所有它们本质上是对称的; (2)两个方程的分母完全相同; (3)三变量情形是双变量的自然推广。;得到偏回归系数的OLS估计量,既可以推出这些估计量的方差和标准误。我们计算标准误有两个目的:建立置信区间和检验统计假设。下列公式不加证明的给出,相关推导过程请参阅文献。;仿照前章,我们能够证明δ2的一个无偏估计量是(注意:这里的自由度是(n-3),因为我们在估计残差之前必须要估计参数β1、β2和β3 ,所以消耗了3个自由度。);1.5 OLS估计量的性质 1. 三变量回归线(面)通过均值 。(为什么?) 2. 估计的Yi的均值等于真实Yi的均值。证明:;3. 4. 残差 与Y,X2和X3均不相关,于是有 5. 根据式子: 随着X2和X3的相关系数r23增大, 的方差也在增大,在r23=1时,完全共线性,这些方差变得无限大。直观地看,随着r23的增大,要知道β2和β3的真值越来越难。而X的样本值变化越大(x越大),则方差越小,从而能够更精确的估计β2和β3 。;1.6 复判定系数R2 在三变量模型中,我们想知道Y的变异由X2和X3联合解释的比例,提供这一信息的数量被称为复相关系数,记为R2。;式中各项均可以从样本数据中计算得出,因此R2也很容易得到。R2是一个落在0和1之间的数。如果是1,则所拟合的回归线100%的解释了Y的变异;如果是0,则模型不解释任何Y的变异。R2越靠近1,说明模型的“拟合”越好。 1.7 校正的R2 R2有一个重要的性质,即它是出现在模型中的解释变量个数的非减函数。随着解释变量个数的增加, R2必然增大而不会减少。回忆R2的定义: 这里, 与模型中X的变量没有关系。但是RSS即 与模型中的X个数有关。随着X的个数增加, 模型的 很可能减小(至少不会变大),随之,R2变大。;那么,怎样解决这个问题呢?我们必须考虑到模型中X变量的个数,那么: 也就是说,分子分母均除以其自由度(df),这样我们就消除了由于解释变量增加而带来的R2变大的问题, 被称为校正的R2(adjusted R2)。 在计算中要先计算均值,故损失一个自由度,自由度为(n-1), 的自由度中的k,是指包括截距项在内的模型中的参数的个数。在三变量模型中, 的自由度是(n-3)。 ;2. 复回归分析:推断问题;注意,自由度为n-3是因为我们在计算 和 之前,我们必须先要估计三个回归系数,从而给残差平方和(RSS)的计算加上了三个约束。于是,t分布可用于建立关于真实总体偏回归系数的置信区域并检验统计假设。同理χ2分布可用于检验关于真实 的假设。 一个例子:美国个人消费与个人可支配收入的关系 假设我们要研究在过去几年中美国个人消费支出的行为,用了下述简单模型: 其中 Y:个人消费支出(PCE) X2:个人可支配收入(PDI) X3:以年计的时间 在用到时间序列数据的回归分析中,我

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档