- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 21
第二章 经典线性回归模型
一、线性回归模型的概念
1、一元线性回归模型
(1)总体回归模型
总体回归模型:,
总体回归方程:
说明:确定性部分——Y对于给定X的期望值
随机部分——代表了排除在模型以外的所有因素对Y的影响。它是期望为0的,具有一定分布的随机变量。
研究的目标:
①确定总体回归方程的参数
②随机扰动项的分布(想想看,为什么?)
(2)样本回归模型
问题:我们往往无法获得全体数据,无法准确的分析出总体回归参数。能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?
画一条直线以尽好地拟合该散点图,由于样本取自总体,可以用该直线近似地代表总体回归线。该直线称为样本回归线。
样本回归模型:
样本回归方程:
(3)样本回归线与总体回归线的关系
2、多元线性回归模型
在许多实际问题中,我们所研究的因变量的变动可能不仅与一个解释变量有关。
斜率 “β”的含义是其它变量不变的情况下,Xj改变一个单位对因变量所产生的影响
即对于n组观测值,有
定义:
多元线性回归模型的矩阵形式为(总体):,
(样本),
二、经典线性回归模型的统计假设
引言:为什么要做基本假定
①为了保证参数估计得以进行(或者有意义)
②为保证参数估计量具有良好的性质。
③对于随机扰动的分布作出假定,才可能确定所估计参数的分布性质,也才可能进行假设检验
(1)线性假定。总体模型为
(2)严格外生性
即E(ut|X)=0, t=1,2,…,n;
含义:ut与所有解释变量都不相关
注;如果E(ut|X)=c,c为某常熟,但不一定为0.当回归方程中有常数项时,可以将这个非零的期望c并入常数项。
命题1:,扰动项的无条件期望为0
命题2,随机变量与扰动项正交。
(3)球形假定
无自相关假设
cov( ui, uj|Xi,Xj) = 0,即E(ui uj|Xi,Xj)=0, i≠j
含义:表明产生干扰的因素是完全随机的。此次干扰和彼此干扰互不相关,相互独立
同方差假设
,即:
含义:①所需估计的方差数简化为一个。
②可以推出,因变量可能取值的分散程度也是相同的。
③每个观测的可信程度是一样的。
(2)(3)可以合并为:
假设(2),(3)说明随机项u的方差-协方差矩阵为对角矩阵:
(4)各解释变量之间不存在严格的线性关系(即不存在“严格的多重共线性”)
即X是满秩的。此时矩阵X’X也是满秩的,
所以行列式 ,保证了 可逆。是OLS估计可以进行的前提。
含义:
①从直观含义来看。模型中的变量对于解释Y提供了新的信息,不能由其他信息完全替代
②从参数的含义来看。保持其他信息不变时,如果存在严格多重共线,则无法做到
③从系数的求解来看:缺少足够信息将两变量的影响区分开来
三、最小二乘估计
1、最小二乘估计原理
分析:直观上看,也就是要求在X和Y的散点图上穿过各观测点画出一条“最佳”直线,如下图所示。
选择一个好的拟合标准。,使得拟合的直线为最佳 。
因可正可负,所以取 最小。
取最小值
2、最小二乘估计的正规方程
最小二乘方法要求残差平方和最小
即,满足
可以写成:
也就是(正规方程,矩条件):
3、一元线性回归模型的最小二乘估计
例如:一元线性回归的最小二乘估计
最小化:即找到使得残差平方和最小的参数近似值
用残差表示得到: ,并可以推导得到:
正规方程:
得参数估计:
可以从两个角度来理解参数估计:
①、参数估计量
给出了两个(随机的)估计量,此时强调估计量受到一个确定性变量和一个随机变量的影响。因此也是随机的。(估计量的分布是怎样的?)
②、参数估计值
将的具体观测数据带入公式,计算出具体的数值。此时表现为一个确定的数字。
4、最小二乘估计的矩阵表示
(具体可以参考陈强的书)
我们的目标是使得回归的残差平方和达到最小,即:
则它的一阶条件为:
化简得:
四、OLS估计量的性质
1、线性性(有助于确定估计量的分布)
2、无偏性(有助于确定正态分布的均值)
即
其中,
两边取期望
与零均值假定,以及非随机解释变量两个假设有关
3、最小方差性(有助于确定正态分布的方差)
(1)方差-协方差矩阵:
(2)方差协方差矩阵的计算
方法1:
方法2
估计量的方差协方差矩阵为:
五、最小二乘估计量的分布
1、多元线性回归中的无偏估计为
k为所有参数的个数,包括常数项。n-k是自由度
可以得到:
①估计量的方差为:
②样本方差为:
③样本标准差为:
2、OLS估计的分布
OLS估计量是随机变量,必须确定其分布才能进行区间估计和假设检验
分析:
①分布:根据线性性的性质:
随机干扰项是服从
原创力文档


文档评论(0)