- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章设差与测量误差
*第九章 设定误差与测量误差 本章内容本科教学供选择
本章内容本科教学供选择
引子:
简单一定胜于复杂吗?
西方国家盛行“Occam`s razor”原则 见古扎拉蒂《计量经济学》下册第447页,中国人民大学出版社,2000,意思是“简单优于复杂”
见古扎拉蒂《计量经济学》下册第447页,中国人民大学出版社,2000
在研究进口数量时,分析进口(IM)与国内生产总值(GDP)、汇率(EX)的关系,建立并估计了以下模型
t= (-2.268276) (7.71607) (-5.66842) (-6.857844) (1)
DW=2.047965 F=286.5846
如果根据“简单优于复杂”的原则,直接分析进口与国内生产总值的关系, 得到回归结果
t = (-2.0288) (16.2378) (2)
DW=0.5357 F=263.6657
这两个方程的t检验和F检验结果显示都显著,方程(2)中GDP的t检验值还优于方程(1),而且方程(2)函数形式也更为简单。能否根据“Occam`s razor”原则,判断简单的方程(2)比复杂的方程(1)更好呢?
对模型的设定是计量经济研究的重要环节。所设定的模型要求正确地描述被解释变量与解释变量之间的真实关系,在第二章提出线性回归模型的基本假定时,除了对随机扰动项分布的假定以外,也强调了假定模型对变量和函数形式的设定是正确的,假定模型中的变量没有测量误差。但是在实际的建模实践中,对模型的设定不一定能够完全满足这样的要求,从而会使模型出现设定误差。本章以OLS估计为基础,分别讨论模型设定误差的后果以及检验方法。
第一节 设定误差
一、设定误差的类型
计量经济模型是对变量间经济关系因果性的设想,若所设定的回归模型是“正确”的,主要任务是所选模型参数的估计和假设检验。若检验统计量和等在统计意义上是显著的,则模型的建模过程结束。反之,若这些统计量中的一个或多个不显著,我们就会去寻找其他的估计方法进行参数估计和检验,例如,在加权和广义差分的基础上用最小二乘法解决异方差性或自相关性问题。但是如果对计量模型的各种诊断或检验仍不能令人满意,这时就应把注意力集中到模型的设定方面,考虑所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正确?随机扰动项的设定是否合理?关于被解释变量和解释变量的数据收集是否有误差?等等。所有这些,在计量经济学中被统称为设定误差。
从误差来源看,设定误差主要包括:(1)变量的设定误差,包括相关变量的遗漏(欠拟合)、无关变量的误选(过拟合);(2)变量数据的测量误差;(3)模型函数形式的设定误差; (4)随机扰动项设定误差。本章主要讨论前两类设定误差。
出现设定误差的原因是多方面的。首先,数据来源渠道可能不畅。在建模过程中,尽管某个变量有着重要的经济意义和计量经济学解释作用,但这个变量的数据很难取得,而被迫将该变量排斥在模型之外,例如消费行为分析中消费者财富的变量就是例证。其次,虽然知道模型中应当包含哪些变量,但却不知道这些变量应当以什么确切的函数形式出现在回归模型中。也就是说,经济管理的基本理论并没有提示模型中变量的准确函数形式。例如,经济学理论不会肯定消费水平与有关变量的关系是线性的还是对数线性的,或者是两者的某种混合形式的。最后,更为重要的是,事实上我们事先并不知道所研究的实证数据中所隐含的真实模型究竟是什么。正是上述这些原因,设定误差在建模中是较容易出现的。设定误差的存在可能会对模型形成不良的后果。
二、变量设定误差的后果
变量设定误差主要有两类:一类是相关变量的遗漏,也称为模型“欠拟合”;另一类是无关变量的误选,也称为模型“过拟合”。从实质上看,变量设定误差的主要后果,是一个或多个解释变量与随机扰动项之间存在着相关性,而影响参数估计的统计特性。
1、遗漏相关变量(欠拟合)的偏误
采用遗漏了重要解释变量的模型进行估计而带来的偏误,称为遗漏相关变量偏误。
如果正确的模型应当为:
(9.1)
其离差形式为 (9.2)
但是由于某种原因,设定模型时将变量遗漏了,实际采用的回归模型为:
(9.3)
假定其他有关线性模型的古典假设都成立,则(9.3)式中的OLS估计式为:
(9.4)
将正确模型的离差形式(9.2)式代入
原创力文档


文档评论(0)