- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 多重共线性 (Multicollinearity) 学习要点 一、多重共线性的含义 二、多重共线性来源及对OLSE性质的影响 三、多重共线检验:可决系数法、方差膨胀因子 四、多重共线的解决办法:逐步回归法 五、遗漏重要解释变量的后果 六、理解案例 一、多重共线性的含义 二、举例 2、完全共线 3、多重共线及其引申 4. 解释变量间可能存在相关性的案例举例 ◆农业生产函数 ◆总成本函数 ◆商品需求函数 ◆商品供给函数 ◆宏观消费模型-在假定当前消费受过去形成的习惯影响时,方程可写为: ◆宏观储蓄模型-储蓄行为受收入水平和利率影响,用方程表示为 ◆生产与投资(多项式分布滞后) 5)模型包括过多的解释变量 模型中解释变量的个数必须小于观察值个数。 6)不同类型的数据出现多重共线的原因不同,程度也不同: 对于时间序列数据,变量之间经常存在共同的运动趋势(收入增长与财富积累),或由于共同受第三个变量的影响而出现相类似的变动(通货膨胀)。截面数据可能出现接近等比例的变化(农业生产中劳动投入和物质投入与面积大小成正比)。 2、多重共线的性质 对于多重共线可以从性质上做如下划分: ◆总体现象:变量通过内在的机制共同运动,此时不管用什么样的抽样方法,得到的样本总会表现出较强的多重共线问题。 例:收入和财富之间的关系。 ◆样本现象:即使总体不存在变量之间的共同运动趋势,抽取的样本仍可能出现多重共线,即样本含有的信息不够丰富,未能充分反映总体的变异情况,导致无法分离每个X单独对Y产生的影响。 ◆模型设定问题:例如多项式模型中的解释变量为同一变量的高阶形式。当该变量变异较小时,会出现较强的多重共线。 3、多重共线的影响(后果) 1) 估计值b极为敏感,不稳定、失真(符号错;经济含义 不合理;字长不一、样本容量不一结果不一。) 2) XX 的行列式值下降,b的方差、协方差变大; 3) R2非常高,t 值很小,统计推断失效; 4) 模型的分析功能下降。 3、方差扩大因子法 借助于解释变量的方差扩大因子(Variance Inflation Factor,VIF)来衡量多重共线的严重程度。设 为解释变量 对其余 个解释变量的可决系数,则 的方差扩大因子定义为: ◆一般情况下0≦ ﹤1,可知 VIFj≥1; ◆ 越大, VIFj 越大,多重共线越严重; ◆经验表明,当VIFj ≥10时,就说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计量。 ◆模型参数OLS法估计量的方差(以二元线性回归为例,见教材P92推导过程)): ◆ 只有当两个解释变量 完全无关时才会有r=0,即得到关于方差的无偏估计。 ◆ 将不必要的解释变量引入模型,一般地,估计参数b的方差要增大,即估计参数的有效性降低。 七、案例分析:收入、财富与消费 消费与收入和财产的关系: 理论模型Cons=f(Y+,W+),其中Cons为消费支出,Y为收入,W为财富。+号表示对Cons预期有正的影响。 经验表达式:Consi=?0+?1Yi+?2Wi+ei ◆去掉任何一个解释变量后,对数据的拟合程度仍很好, 估计系数高度显著,但却是有偏的; ◆可以利用经验判断或其他信息,假定某个变量的系数或两个系数的比率,在估计时作为约束条件; ◆增加含有新信息的观察值,例如后两个观察值所反映的信息不同于前面的观察值,分别为高收入低财产和低收入高财产情况。 利用前10组数据估计方程得到: ◆查F统计表得知,当显著性水平选择为1%时,与自由度为(2,7)对应的F临界值为9.55,据此应拒绝原假设 。 ◆然而两个解释变量的t统计值均未达到较高的显著性水平,即原假设 无法被拒绝。 ◆两种统计检验出现相互矛盾的结果。 ◆去掉任一解释变量后估计得到: ◆根据其它研究获得的信息做估计: 假定 ,原方程可以改写为 估计得到 假定 ,原方程可以改写为: 估计得到: ◆增加两个新的观察值(分别为高收入低财富和低收入高财富)后重新估计得到:
您可能关注的文档
最近下载
- 高中生物实验室仪器标准配置全套.docx VIP
- 科技论文的写作.pptx VIP
- 低血糖的识别与处理考核试题及答案.docx VIP
- 【部编版】小学五年级语文上册全册复习ppt课件【完整版】.pdf VIP
- 2025年辅警考试真题及答案.docx VIP
- 2025及以后5年中国城市更新行业市场运行格局及投资前景分析报告.docx
- 2025年高考化学真题分类汇编 专题12 有机化学基础(原卷版).docx VIP
- 食品添加剂 食品添加剂 食品添加剂02_食品防腐剂.ppt VIP
- 2026版高三一轮总复习(语文)专项对点练7品悟情境设置,研读看法措施与实际应用题(含答案).pdf VIP
- 食品添加剂 食品添加剂 食品添加剂07_食品调味剂.ppt VIP
原创力文档


文档评论(0)