最终形成共线性不严重的回归模型.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四节 多重共线性的修正与补救措施 ★ 多重共线性的修正是指通过有效的手段,再付出较小代价的前提下,解决共 线性对模型估计的不利影响,这意味着,在解决共线性问题时,除了要选择 可行的方法修正共线性之外,还有一个重要的工作是评估该补救措施的实施 所付出的代价。 ★Do Nothing的处理方法: 由此,有部分的观点认为:共线性并不是一个统计问题,而是由数据缺陷所造成, 对于所能有的数据我们无能为力。而任何的修正也许导致“灾难性”的后果,共线 性严重就意味着,在当前数据条件下,是不存在解决之道的 一、增大样本容量 思路:共线性是一个样本现象,故通过扩大样本容量,可以改变共线性程度,此外, 更高的自由度意味着参数方差的缩小,这可以弥补共线性的影响。因此应尽 可能的搜集样本改善参数估计。 应用限制:1、扩大样本容量在现实中往往很难实现 2、实际效果难以保证 ----可行的扩充自由度方法:将时序或截面数据拓展为面板数据 二、工具变量法 思路:寻找工具变量以替换某个或某几个解释变量,以降低共线性程度。 工具变量应满足:与替代目标高度相关 and 与其他变量相关程度低 应用限制:1、工具变量在现实中难以获取 2、会丧失一定的经济含义 ----常见替代过程:工业增加值替代工业总产值 私有住房面积替代收入 三、变量变换法 思路:对部分解释变量进行变换,以降低解释变量间的共线性程度,其实质是样本替 代和样本变换。 A:绝对指标变相对指标 B:对变量做差分处理 C:将几个变量捏合为一个 应用限制:1、变换往往意味着经济含义的模糊和丧失 2、可能导致自相关、异方差等违背经典假设的问题。 3、修正共线性的功效难以保证 四、逐步回归法 思路:将解释变量按照对被解释变量的贡献程度排序,依照一定规则剔除一个或多个 变量,进而降低模型的共线性程度。 具体步骤:1、用被解释变量对每个解释变量逐一进行二元辅助回归,并按照辅助回 归的 对解释变量排序; 2、以对被解释变量贡献最大的解释变量所对应的辅助方程为基础,按对 被解释变量贡献大小的顺序逐个引入其余的解释变量; 3、依照筛选规则决定引入变量应保留在模型中,还是剔除; 4、最终形成共线性不严重的回归模型。 保留 剔除 剔除 若新变量的引入改进了 和 F 检验,且原有变量的显著性与符号未发生变化,加入变量的t 检验也是显著的,则在模型中保留该变量 逐步回归的筛选规则 若新变量的引入未改善 和 F 检验,且原有变量的显著性与符号未发生变化,加入变量的t 检验不显著,则该变量为多余变量,应剔除 若新变量的引入使得原有变量的显著性与符号出现了变化,或者参数估值出现了较大变化,则表明该变量的引入引起了严重的共线性,应 剔除 方法评价: 1、利用逐步回归法修正多重共线性效果显著,因为其实际是从根本上剔除 了产生共线性的变量。 2、这种剔除很可能破坏了模型背后的经济理论,进而犯“过度挖掘”的错误, 最终得到一个统计正确而理论错误的模型。 3、逐步回归法应用的代价较高,很可能导致其他违背经典假设的问题出现,现实 问题中采用时必须考虑其实际成本。 第五节 案例分析 例1:持续的高速增长使得我国能源要素的安全供应与环境污染问题日趋严重,以 下尝试建立我国能源消费量的影响因素模型,具体模型如下: 其中,eng为能源消费量,inc为国民总收入,gdp为人均GDP,ind为工业总产值, bul为建筑业总产值,ext 为全社会居民人均用电量,enf为单位能源的产出 多个变量不显著 极高的拟合优度与F检验 与常识不符的参数符号 A:OLS估计结果: B:多重共线性的检验 1、变量间的相关系数矩阵: 多个变量间存在高度的简单线性相关 四、R 2及校正R 2(3) 2、克莱因法则检验: 对解释变量进行辅助回归,发现在EXT做被解释变量时,回归的 拟合优度达到0.9892,已超过原始回归模型的 得出结论:模型存在严重多重共线性 C:用逐步回归法修正共线性 1、进行被解释变量对各解释变量的辅助回归 变量 inc gdp ind bul ext enf 拟合优度 0.8656 0.8644 0.8541 0.859

文档评论(0)

yusuyuan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档