第6章设定选择解释变量FF.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章设定选择解释变量FF

第六章 模型设定:选择解释变量 6.1 遗漏变量 6.2 不相关变量 6.3 滥用模型设定准则的一个实例 6.4 模型设定搜索 6.5 选择自变量的一个例子 6.6 总结和练习 6.7 附录:另一模型设定准则 在任何一个方程被估计之前,它的设定必须是完备的。一个计量经济方程的设定由三部分组成:选择正确的解释变量、正确的方程形式、以及正确的随机误差形式。 任何一部分的选择错误都会造成模型的设定误差。本章仅介绍第一部分即选择变量,第二和第三部分将在以后的章节中予以阐述。 从计量经济学的角度看,由研究者决定将哪些变量包括在回归方程中,既有优势也有不足。优势在于可以根据研究者个人的需要建立公式化的回归方程,而不足在于研究者可以估计很多设定直到发现能“证明”他们的观点的设定为止,尽管其他的研究结果不能证明这一观点。本章的主要目的是帮助你理解如何为你的回归选择解释变量,从而使你的回归结果不至于成为滥用选择变量技巧的牺牲品。 决定一个解释变量是否应包含在方程中,最主要的考虑是根据理论判断这一变量对于回归方程是否是必不可少的。如果答案是不含糊的,那么该变量无疑应该包含在方程中,即使它在统计上似乎缺乏显著性。如果理论上含糊不清或没有强调,就会出现进退两难的情况。去掉相关变量很可能导致方程中余下变量的系数估计的有偏性,但是包含一个不相关变量则会造成估计系数的方差过大。尽管我们将会发展统计工具帮助我们做出这个决定,但是在实际中仍然很难确定一个变量是否是相关变量,所以这个问题仍然没有解决。 第四节介绍模型设定的搜索,以及各种搜索方法的利与弊。例如,粗劣的模型设定搜索经常会造成有偏或使通常的显著性检验不适用。因此,我们建议在选择变量时尽可能地减少待估变量的个数,同时尽可能依据理论而不是统计上的适合度来判断。关于模型设定并没有标准答案,最终的选择取决于每一个研究者。 6.1省略(或遗漏)变量 假如在你初次设定方程时没有考虑到某个相关的解释变量(毕竟,人无完人!)或者虽然考虑到了该变量但搜集数据非常困难,从而导致省略了这个解释变量,即,在回归方程中省略了一个重要的解释变量。 无论什么时候,遗漏(或省去)一个变量对估计方程的解释和使用都应值得怀疑。遗漏一个相关变量,比如需求函数中的价格,不仅使你无法得到价格系数的估计,通常还会造成方程所含变量的系数估计值的有偏性。 由于遗漏一个变量而造成的偏误叫做遗漏变量偏误(更一般的称为设定偏误)。在多于一个自变量的方程中,系数表示保持方程中其它自变量不变的条件下,自变量变化一个单位导致应变量Y相应的变化量。如果某个变量被遗漏了,那么它就不是方程中的自变量,在估计和解释时就无法保持该变量不变。这种遗漏会导致偏误:即迫使估计的系数(即,译者注)的期望值偏离总体系数的真实值。 因为方程中所保留的变量的系数估计值可能是有偏的,所以遗漏一个相关变量通常是作为估计方程值得怀疑的证据。下面我们详细讨论这个问题。 6.1.1省略一个解释变量的后果 方程中遗漏一个重要变量(或许是因为无法搜集到相应的数据,或许是因为第一阶段没有考虑到该变量)会发生什么呢?方程中遗漏一个相关自变量最主要的后果是导致回归系数的有偏性。假设真实的回归模型如下: (6-1) 是经典误差项。如果遗漏了,则方程变为: (6-2) 此时,为: (6-3) 如1.2.3节所提到的,随机误差项包含了所有遗漏变量的影响。从方程(6-2)和(6-3)看,虽然我们遗漏了,似乎仍可以得到和的无偏估计。不幸的是,事实并非如此,方程中所包含变量的系数几乎总会在一定程度上受到遗漏变量的影响,于是其估计值发生改变引起估计的偏误。为考察产生偏误的原因,我们不妨再看看(6-2)和(6-3)式。绝大多数成对的变量之间都会有某种程度的相关,虽然有些相关是随机的,所以和之间几乎必然是相关的。如果方程(6-1)中遗漏变量,则的影响被归入,于是和相关。故由于遗漏,和都会随着的改变而改变,那么误差项与解释变量之间就不再是相互独立的了。这就违背了经典假设Ⅲ! 换句话说,除非与方程中已含的所有变量都是不相关的(这种情况几乎不可能),否则,如果遗漏了一个重要的变量将会违背经典假设Ⅲ(解释变量与误差项相互独立)。一般来讲,只要违背了一个经典假设,高斯—马尔科夫定理便不成立,OLS估计量也不再是线性无偏最优估计量。对于给定的线性估计量,这就意味着系数估计值不再是无偏的或者不满足方差最小(在所有线性无偏

文档评论(0)

zhanghc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档