第五讲-多重共线性、异方差、自相关要点.pptVIP

下载本文档

29
0
约1.09万字
约 70页
2017-05-16 发布于湖北
举报
版权申诉

第五讲-多重共线性、异方差、自相关要点.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一、多重共线性的概念二、多重共线性的后果三、多重共线性的诊断四、克服多重共线性的方法五、案例一、多重共线性的概念 2、近似共线性下OLS估计量非有效如果模型中两个解释变量具有线性相关性，例如 X2= ?X1 ，这时，X1和X2前的参数?1、?2并不反映各自与被解释变量之间的结构关系，而是反映它们对被解释变量的共同影响。 ?1、?2已经失去了应有的经济含义，于是经常表现出似乎反常的现象：例如?1本来应该是正的，结果恰是负的。多重共线性诊断的任务是：（1）检验多重共线性是否存在；（2）估计多重共线性的范围，即判断哪些变量之间存在共线性。 (1)对两个解释变量的模型，采用简单相关系数法求出X1与X2的简单相关系数r，若|r|接近1，则说明两变量存在较强的多重共线性。如果存在多重共线性，需进一步确定究竟由哪些变量引起。具体可进一步对上述回归方程作F检验：式中：Rj?2为第j个解释变量对其他解释变量的回归方程的可决系数，若存在较强的共线性，则Rj?2较大且接近于1，这时（1- Rj?2 ）较小，从而Fj的值较大。因此，给定显著性水平?，计算F值，并与相应的临界值比较，来判定是否存在相关性。在模型中排除某一个解释变量 X j，估计模型；如果拟合优度与包含X j时十分接近，则说明X j与其它解释变量之间存在共线性。 (2)逐步回归法以Y为被解释变量，逐个引入解释变量，构成回归模型，进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。如果拟合优度变化显著，则说明新引入的变量是一个独立解释变量；如果拟合优度变化很不显著，则说明新引入的变量与其它变量之间存在共线性关系。找出引起多重共线性的解释变量，将它排除出去。以逐步回归法得到最广泛的应用。注意：这时，剩余解释变量参数的经济含义和数值都发生了变化。时间序列数据、线性模型：将原模型变换为差分模型: ?Yi=?1 ? X1i+?2 ? X2i+?+?k ? Xki+ ? ?i 可以有效地消除原模型中的多重共线性。多重共线性的主要后果是参数估计量具有较大的方差，所以采取适当方法减小参数估计量的方差，虽然没有消除模型中的多重共线性，但确能消除多重共线性造成的后果。例如：增加样本容量可使参数估计量的方差减小。六、案例——中国粮食生产函数根据理论和经验分析，影响粮食生产（Y）的主要因素有：农业化肥施用量（X1）；粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) R2接近于1；给定?=5%，得F临界值 F0.05(5,12)=3.11 F=137.11 3.11，故认上述粮食生产的总体线性关系显著成立。但X4 、X5 的参数未通过t检验，且符号不正确，故解释变量间可能存在多重共线性。发现： X1与X4间存在高度相关性。可见，应选第1个式子为初始的回归模型。将其他解释变量分别导入上述初始回归模型，寻找最佳回归方程。回归方程以Y=f(X1，X2，X3)为最优： 2.自相关产生的原因大多数经济时间数据都有一个明显的特点，就是它的惯性。 GDP、价格指数、生产、就业与失业等时间序列都呈周期性，如周期中的复苏阶段，大多数经济序列均呈上升势，序列在每一时刻的值都高于前一时刻的值，似乎有一种内在的动力驱使这一势头继续下去，直至某些情况（如利率或课税的升高）出现才把它拖慢下来。（2）设定偏误1：模型中未含应包括的变量例如：如果对牛肉需求的正确模型应为 Yt=?0+?1X1t+?2X2t+?3X3t+?t 其中：Y=牛肉需求量，X1=牛肉价格， X2=消费者收入，X3=猪肉价格如果模型设定为： Yt= ?0+?1X1t+?2X2t+vt 则该式中，vt= ?3X3t+?t, 于是在猪肉价格影响牛肉消费量的情况下，这种模型设定的偏误往往导致随机项中有一个重要的系统性影响因素，使其呈序列相关性。 (3)设定偏误2：不正确的函数形式例如：如果真实的边际成本回归模型应为： Yt= ?0+?1Xt+?2Xt2+?t 其中：Y=边际成本，X=产出，但建模时设