第一部分2 经典线性回归模型.docVIP

下载本文档

2
0
约5.21千字
约 21页
2019-06-29 发布于湖北
举报
版权申诉

第一部分2 经典线性回归模型.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE 21 第二章经典线性回归模型一、线性回归模型的概念 1、一元线性回归模型（1）总体回归模型总体回归模型：，总体回归方程：说明：确定性部分——Y对于给定X的期望值随机部分——代表了排除在模型以外的所有因素对Y的影响。它是期望为0的，具有一定分布的随机变量。研究的目标： ①确定总体回归方程的参数 ②随机扰动项的分布（想想看，为什么？）（2）样本回归模型问题：我们往往无法获得全体数据，无法准确的分析出总体回归参数。能从一次抽样中获得总体的近似的信息吗？如果可以，如何从抽样中获得总体的近似信息？画一条直线以尽好地拟合该散点图，由于样本取自总体，可以用该直线近似地代表总体回归线。该直线称为样本回归线。样本回归模型：样本回归方程：（3）样本回归线与总体回归线的关系 2、多元线性回归模型在许多实际问题中，我们所研究的因变量的变动可能不仅与一个解释变量有关。斜率 “β”的含义是其它变量不变的情况下，Xj改变一个单位对因变量所产生的影响即对于n组观测值，有定义：多元线性回归模型的矩阵形式为（总体）：，（样本），二、经典线性回归模型的统计假设引言：为什么要做基本假定 ①为了保证参数估计得以进行（或者有意义） ②为保证参数估计量具有良好的性质。 ③对于随机扰动的分布作出假定，才可能确定所估计参数的分布性质，也才可能进行假设检验（1）线性假定。总体模型为（2）严格外生性即E(ut|X)=0, t=1,2,…,n；含义：ut与所有解释变量都不相关注；如果E(ut|X)=c，c为某常熟，但不一定为0.当回归方程中有常数项时，可以将这个非零的期望c并入常数项。命题1：,扰动项的无条件期望为0 命题2，随机变量与扰动项正交。（3）球形假定无自相关假设 cov( ui, uj|Xi,Xj) = 0,即E(ui uj|Xi,Xj)=0, i≠j 含义：表明产生干扰的因素是完全随机的。此次干扰和彼此干扰互不相关，相互独立同方差假设，即：含义：①所需估计的方差数简化为一个。 ②可以推出，因变量可能取值的分散程度也是相同的。 ③每个观测的可信程度是一样的。（2）（3）可以合并为：假设（2），（3）说明随机项u的方差－协方差矩阵为对角矩阵：（4）各解释变量之间不存在严格的线性关系（即不存在“严格的多重共线性”）即X是满秩的。此时矩阵X’X也是满秩的，所以行列式，保证了可逆。是OLS估计可以进行的前提。含义： ①从直观含义来看。模型中的变量对于解释Y提供了新的信息，不能由其他信息完全替代 ②从参数的含义来看。保持其他信息不变时，如果存在严格多重共线，则无法做到 ③从系数的求解来看：缺少足够信息将两变量的影响区分开来三、最小二乘估计 1、最小二乘估计原理分析：直观上看，也就是要求在X和Y的散点图上穿过各观测点画出一条“最佳”直线，如下图所示。选择一个好的拟合标准。，使得拟合的直线为最佳。因可正可负，所以取最小。取最小值 2、最小二乘估计的正规方程最小二乘方法要求残差平方和最小即，满足可以写成：也就是（正规方程，矩条件）： 3、一元线性回归模型的最小二乘估计例如：一元线性回归的最小二乘估计最小化：即找到使得残差平方和最小的参数近似值用残差表示得到：，并可以推导得到：正规方程：得参数估计：可以从两个角度来理解参数估计： ①、参数估计量给出了两个(随机的）估计量，此时强调估计量受到一个确定性变量和一个随机变量的影响。因此也是随机的。（估计量的分布是怎样的？） ②、参数估计值将的具体观测数据带入公式，计算出具体的数值。此时表现为一个确定的数字。 4、最小二乘估计的矩阵表示（具体可以参考陈强的书）我们的目标是使得回归的残差平方和达到最小，即：则它的一阶条件为：化简得：四、OLS估计量的性质 1、线性性(有助于确定估计量的分布) 2、无偏性（有助于确定正态分布的均值）即其中，两边取期望与零均值假定，以及非随机解释变量两个假设有关 3、最小方差性（有助于确定正态分布的方差） (1)方差-协方差矩阵：（2）方差协方差矩阵的计算方法1：方法2 估计量的方差协方差矩阵为：五、最小二乘估计量的分布 1、多元线性回归中的无偏估计为 k为所有参数的个数，包括常数项。n-k是自由度可以得到： ①估计量的方差为： ②样本方差为： ③样本标准差为： 2、OLS估计的分布 OLS估计量是随机变量，必须确定其分布才能进行区间估计和假设检验分析： ①分布：根据线性性的性质：随机干扰项是服从