- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
中级计量经济学第四章模型设定错误
第四章
模型设定错误
主要内容
模型设定错误有广义和狭义两种情况
狭义的错误指模型设定出现丢失重要解释变量、包括不必要的解释变量、解
释变量测度存在误差等情况;
广义的错误还包括多重共线、残差项出现异方差或序列相关等情况。
当出现模型设定错误时,利用OLS方法得到的参数估计不再具有最小方差和
无偏性质。
主要内容
多重共线
模型变量设定错误
遗漏必要的解释变量
包括不必要的解释变量
解释变量含有测度误差
误差项不符合古典假定
回归方程函数形式错误
检验和解决办法
多重共线
根据古典假定,矩阵X#039;X应该是满秩的,即X#039;X可逆。
若数据违反上述假定,那么出现解释变量间的完全多重共线。
在实际工作中,由于数据原因造成的解释变量完全多重共线并不常见,并且
多数是由于模型设定错误。经常遇到的情况是解释变量之间的不完全多重共线。
令rj为不同时为零的常数,上述两种情况可以表示为:
完全的多重共线
不完全的多重共线(vi为一随机误差项)
不同性质的多重共线
右表中,X1与X2为完全的多重共线,即:
X2=5X1
X1与X3则为不完全多重共线,即:
X2=5X1+v
Corr(X1,X2)=0.999
152
150
30
119
120
24
94
90
18
75
75
15
52
50
10
X3
X2
X1
多重共线
多重共线是由于解释变量之间存在较高的相关性。
经济变量之间总会存在较高的相关性,差别仅仅是在相关的程度上,因而在
应用工作中常常难以避免多重共线问题。
当解释变量高度相关时,估计模型参数遇到困难。
从数学角度解释,这就是说,当两个变量存在共同的运动模式时,采用统计
手段分离两者各自对因变量的影响将是非常困难的。
多重共线的来源
数据收集方法不当
抽样集中在一个非常类似的子群体;
例1:对同一地点贫困人口的调查,多数指标相近。
例2:对同一地点农户农业生产的调查,很多投入与土地成比例(技术、市
场和制度环境相近)。
总体存在经济指标相关,抽样时未采取对策;
例:高收入户通常家庭资产也多,但可能通过适当的抽样方法(分层/配额
抽样)取得变异大的样本。
模型设定
在模型中包括同一变量的不同变型(X变异小时更严重)
例:Y=??0+??1X+??2X2+e
多重共线的来源
变量有共同的时间趋势
多数时间序列数据呈现增长趋势
例:人口、GDP、进出口、城市化率、粮食单产…
以价值计量的经济指标都会受通货膨胀的影响
例:GDP、税收、商品价格、居民收入、居民消费支出
模型包括过多的解释变量
模型中解释变量个数大于或等于观察值个数
多重共线
不同类型的数据出现多重共线的原因不同,程度也不同:
对于时间序列数据,变量之间经常存在共同的运动趋势(收入增长与财富积
累),或由于共同受第三个变量的影响而出现相类似的变动(通货膨胀)。
截面数据可能出现接近等比例的变化(农业生产中劳动投入和物质投入与面
积大小成正比)。
一般而言,使用时间序列数据建立模型时更可能遇到多重共线问题。
多重共线的性质
对于多重共线可以从性质上做如下划分:
总体现象:变量通过内在的机制共同运动,此时不管用什么样的抽样方法,
得到的样本总会表现出较强的多重共线问题。
例:收入和财富之间的关系。
样本现象:即使总体不存在变量之间的共同运动趋势,抽取的样本仍可能出
现多重共线,即样本含有的信息不够丰富,未能充分反映总体的变异情况,导致
无法分离每个X单独对Y产生的影响。
模型设定问题:例如多项式模型中的解释变量为同一变量的高阶形式。当该
变量变异较小时,会出现较强的多重共线。
多重共线的影响
在出现完全多重共线时,无法得到模
文档评论(0)