- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章多元(复)回归分析
第三章 多元(复)回归分析;1. 复回归分析:估计问题;其中(6)是说X2与X3之间没有精确的线性关系,专业上称为无共线性或无多重共线性。无共线性是说没有一个解释变量可以写成其余解释变量的线性组合。如果不存在一组不全为零的数λ2和λ3,使得:
如果是这关系存在,我们就说, X2与X3的共线的或线性相关。令一方面,如果这一关系仅当λ2=λ3=0时存在,则X2与X3线性独立。;(a)图表示X2和X3不存在线性关系。(b)图中,区域Y的3和4区域的变异是由于X2引起的,而Y的4和5区域的变异是由于X3引起的,但是区域4是X2和X3共有的,我们无法精确地区别开来,这样区域4代表了共线性。无共线性就要求像(a)图那样,解释变量没有重叠区域。;1.2 对复回归方程的解释
对式子两边求条件期望:
这样,式子给出以变量X2和X3的固定值为条件的Y的条件均值或期望值。如同双变量回归分析,复回归分???是以多个解释变量的固定值为条件的回归分析,并且我们所获取的,是变量X值固定时的Y的平均值或Y的平均响应。;1.3 偏回归系数的含义
偏回归系数的含义如下:β2度量者在保持X3不变的情况下,X2每变化1单位,Y的均值E(Y|X2,X3)的变换。换句话说,β2给出保持X3不变时Y的均值E(Y|X2,X3)对X2的斜率。类似的,β3度量者在保持X2不变的情况下,X3每变化1单位,Y的均值E(Y|X2,X3)的变换。
如何理解保持不变?假定Y代表产出,X2和X3分布代表劳动和资本投入。再假定X2和X3都是生产必须的,且它们用于生产的投入比例可以变换。当劳动投入增加一个单位带来的产出的增加(劳动的边际产量)。在这里有一个前提,就是劳动增加的同时,资本投入的数量保持不变,否则我们无法区分在增加的Y中,哪些是由于劳动X2的增加带来的,哪些是由于资本X3增加带来的。只有想办法使得资本X3投入保持不变,才能衡量劳动X2投入对产出增长的真实贡献。;1.4 偏回归系数的OLS估计
先写出样本回归函数(SRF):
OLS方法是要选择未知参数的值,使得残差平方和尽可能的小,用符号表示为:
对未知数求微分,并令表达式为零,得到下述正则方程:;按照用小写字母表示对样本离差的惯例,解正则方程得:
β2和β3最小二乘估计量的性质:
(1)可以从方程2和方程3中通过x2和x3的对调得到另外一个,所有它们本质上是对称的;
(2)两个方程的分母完全相同;
(3)三变量情形是双变量的自然推广。;得到偏回归系数的OLS估计量,既可以推出这些估计量的方差和标准误。我们计算标准误有两个目的:建立置信区间和检验统计假设。下列公式不加证明的给出,相关推导过程请参阅文献。;仿照前章,我们能够证明δ2的一个无偏估计量是(注意:这里的自由度是(n-3),因为我们在估计残差之前必须要估计参数β1、β2和β3 ,所以消耗了3个自由度。);1.5 OLS估计量的性质
1. 三变量回归线(面)通过均值 。(为什么?)
2. 估计的Yi的均值等于真实Yi的均值。证明:;3.
4. 残差 与Y,X2和X3均不相关,于是有
5. 根据式子:
随着X2和X3的相关系数r23增大, 的方差也在增大,在r23=1时,完全共线性,这些方差变得无限大。直观地看,随着r23的增大,要知道β2和β3的真值越来越难。而X的样本值变化越大(x越大),则方差越小,从而能够更精确的估计β2和β3 。;1.6 复判定系数R2
在三变量模型中,我们想知道Y的变异由X2和X3联合解释的比例,提供这一信息的数量被称为复相关系数,记为R2。;式中各项均可以从样本数据中计算得出,因此R2也很容易得到。R2是一个落在0和1之间的数。如果是1,则所拟合的回归线100%的解释了Y的变异;如果是0,则模型不解释任何Y的变异。R2越靠近1,说明模型的“拟合”越好。
1.7 校正的R2
R2有一个重要的性质,即它是出现在模型中的解释变量个数的非减函数。随着解释变量个数的增加, R2必然增大而不会减少。回忆R2的定义:
这里, 与模型中X的变量没有关系。但是RSS即 与模型中的X个数有关。随着X的个数增加, 模型的 很可能减小(至少不会变大),随之,R2变大。;那么,怎样解决这个问题呢?我们必须考虑到模型中X变量的个数,那么:
也就是说,分子分母均除以其自由度(df),这样我们就消除了由于解释变量增加而带来的R2变大的问题, 被称为校正的R2(adjusted R2)。
在计算中要先计算均值,故损失一个自由度,自由度为(n-1
您可能关注的文档
最近下载
- 芦原义信《外部空间设计》.pdf VIP
- 中考现代文阅读——邓宗良《母亲的叶搭饼》.docx VIP
- 2025年防火涂料项目深度研究分析报告.docx
- CDS2.XwithHPLC操作说明资料.pdf VIP
- Python数据分析及应用 课件 第3、4章 程序的控制结构、函数.pptx
- 2025村道生命防护工程施工组织设计.docx
- 我国隧道盾构掘进机技术的发展现状.doc VIP
- DBJ50_T-460-2023 住房和城乡建设领域数字化企业评价标准(OCR).pdf VIP
- 食材采购配送服务以及售后服务方案.pdf VIP
- 2025年国考行测真题及答案解析(省级与地市级合卷) .pdf VIP
文档评论(0)