[教育学]05-第五章 多重共线性.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[教育学]05-第五章 多重共线性

计量经济学 —理论·方法·EViews应用 山东工商学院统计学院 袁靖 博士 2011.08.10 小结 1.多重共线性是指各个解释变量之间有准确或近似 准确的线性关系。 2.多重共线性的后果: 如果各个解释变量之间有完全的共线性,则它们的 回归系数是不确定的,并且它们的方差会无穷大。 如果共线性是高度的但不完全的,回归系数可估计, 但有较大的标准误差。回归系数不能准确地估计。 3.诊断共线性的经验方法: (1) 表现为可决系数异常高而回归系数的t 检验不显著。 (2) 变量之间的零阶或简单相关系数。多个解释变量时,较低的零阶相关也可能出现多重共线性,需要检查偏相关系数。 (4)如果 高而偏相关系数低,则多重共线性是可能的。 (5) 用解释变量间辅助回归的可决系数判断。 4.降低多重共线性的经验方法: (1)利用外部或先验信息; (2)横截面与时间序列数据并用; (3)剔除高度共线性的变量(如逐步回归); (4)数据转换; (5)获取补充数据或新数据; (6)选择有偏估计量(如岭回归)。 经验方法的效果取决于数据的性质和共线性的严重程度。 二、利用已知信息克服多重共线性 已知信息——就是指在建模之前根据经济理论、统计资料或经验分析, 已知的解释变量之间存在的某种关系。 例: 为了克服多重共线性,可将解释变量按已知关系加以合并。 设消费函数 (5-8) 其中,Y为消费支出,X1为消费者的年平均收入,X2为消费者的年平均储蓄额。 三、通过变换模型形式克服多重共线性 ——不需要分析每个解释变量对被解释变量影响大小 模型对象 例: 设需求函数 (5-12) 其中Y为需求量,X1为居民收入,X2为商品价格,X3为代用品价格。 四、用增加样本容量来克服多重共线性 多重共线性的主要问题在于使参数估计量的方差变大,随机干扰项的 方差、变量的变异程度与方差膨胀因子一起决定着参数估计量的方差。 如果存在多重共线性,但随机干扰项的方差很小,或变量的变异程度很 大都可能得到较小的参数估计量的方差。这时,即使有较严重的多重共 线性,也不会带来不良后果。因此,只要回归方程估计的参数标准差较 小,t统计值较大,就没有必要过于关心是否存在多重共线性的问题。 五、逐步回归法 具体步骤 1)先用被解释变量对每一个所考虑的解释变量做简单回归; 2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础; 3)逐个引入其余的解释变量。 好处 将统计上不显著的解释变量剔除,最后保留在模型中的解释变量之间 多重共线性不明显,而且对被解释变量有较好的解释贡献。 案例分析 一、研究的目的要求 提出研究的问题——为了规划中国未来国内旅游产业 的发展,需要定量地分析影响中国国内旅游市场发展 的主要因素。 二、模型设定及其估计 影响因素分析与确定——影响因素主要有国内旅游 人数 ,城镇居民人均旅游支出 ,农村居民人均 旅游支出 ,并以公路里程次 和铁路里程 作为相关基础设施的代表 理论模型的设定 其中 : ——第 t 年全国国内旅游收入 数据的收集与处理 7.30 180.98 200.0 684.9 87000 3442.3 2003 7.19 176.52 209.1 739.7 87800 3878.4 2002 7.01 169.80 212.7 708.3 78400 3522.4 2001 6.87 140.27 226.6 678.6 74400 3175.5 2000 6.74 135.17 249.5 614.8 71900 2831.9 1999 6.64 127.85 197.0 607.0 69450 2391.2 1998 6.60 122.64 145.7 599.8 64400 2112.7 1997 6.49 118.58 70.5 534.1 63900 1638.4 1996 5.97 115.70 61.5 464.0 62900 1375.7 1995 5.90 111.78 54.9 414.7 52400 1023.5 1994 铁路里 程X6(万公里) 公路里 程 X5(万公里) 农村居民人均旅游支出X4 (元) 城镇居民人均旅游支出X3 (元) 国内旅游人数X2(万人次) 国内旅游收入Y(亿元) 年 份 数据来源:《中国统计年鉴2004》 该模型 , 可决系数很高,F检验值 173.3525,明显显著。 但是当 时 、 不仅 、 系数的t检验不显著,而且 系数的符号与预期的相

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档