第9讲模型设定和数据问题.pptxVIP

下载本文档

87
0
约 42页
2016-12-18 发布于湖北
举报
版权申诉

第9讲模型设定和数据问题.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第9讲模型设定和数据问题

第九讲模型设定和数据问题一、函数形式误设二、代理变量三、测量误差四、数据缺失、非随机样本和异常观测第一节函数形式误设一、函数形式误设的情形如果多元回归模型没有正确地刻画因变量与所观测的解释变量之间的关系，那它就存在函数形式误设问题1.遗漏变量并非所有的遗漏变量都属于函数形式误设的情形，只有当被遗漏的变量是某一解释变量的函数时，我们才称这种对变量的遗漏为函数形式误设。如果模型中遗漏的变量与已有的解释变量之间存在函数关系，那么误差项一定不满足MLR.4（零条件均值的假定）。因此，在这种情况下，OLS估计量一定是有偏的。假定真实模型为：但我们估计的是：则有：其中，为变量x2对变量x1回归时的斜率估计值，在x2与x1之间存在函数关系时，，而作为原模型中应该有的变量，，因此，在这种情况下，OLS估计量一定是有偏的。例1.遗漏了解释变量的平方项工资方程中，正确的方程为：实际估计时漏掉了exper2，所以实际估计的方程为：这种遗漏所造成的函数形式误设通常会导致OLS估计量有偏，即使educ的参数估计量无偏，也会错误地估计工作经历对工资的影响，因为工作经历的实际回报率为，但在误设的模型中，只计算了。例9.1犯罪的经济模型（P294）被解释变量：Narr86（1986年被捕次数）解释变量：pcnv以前被定罪比例avgsen 平均判刑期限，单位：月tottime 18岁以来的服刑时间，单位：月ptime861986年的服刑时间，单位：月qemp861986年被雇佣季度数inc86 1986年合法收入，单位：百美元black 如果是黑人，black=1hispan 如果是西班牙裔，hispan=1首先我们将被解释变量向解释变量回归，不包含任何平方项。回归的结果如下：回归的结果表明，除平均判刑期限（avgsen）和18岁以来的服刑时间（tottime）之外，其他解释变量均在1%的水平上显著，但一些变量的系数符号似乎有些不合常理。如pcnv，ptime86。从常理理解，以前被定罪比例（pcnv）越高，说明这一样本观测点犯罪倾向也就越高，那么其在1986年被捕的次数也就会越多，按照这一假设和推理，以前被定罪比例（pcnv）的系数应该为正，但不含平方项的回归结果表明这一系数为负。同样，一般情况下，若某样本观测点在1986年的服刑时间（ptime86）越高，他在1986年被捕的次数也就会越多，按照这一假设和推理，1986年的服刑时间（ptime86）的系数也应该为正，但不含平方项的回归结果表明这一系数为负。而这些不合常理的系数却都高度显著，因此，我们对这些解释变量对被解释变量的影响方式必须要进一步核准，从而确定他们对被解释变量有意义的解释。加入重要变量的平方项之后，回归结果如下：加入平方项之后，除1986年被雇佣季度数（qemp86）之外，各变量的显著性并没有太大的影响，而且所有的平方项都是显著的，这就意味着不加平方项的模型的确存在误设的可能，而且加入平方项之后，相关变量的系数也更有意义了。见教材P295注意：如果原模型满足假定MLR.4，那么在方程中添加自变量的非线性关系应该是不显著的；在例9.1中添加了显著的二次项，检验出函数形式误设定；如果原模型中有许多解释变量，使用掉大量自由度缺失；添加二次项也不能得到被忽视的某种特定非线性关系；例2.遗漏了解释变量的交互项工资方程中，正确的方程为：实际估计时漏掉了female•educ，所以实际估计的方程为：在原始模型中，教育的回报率会因性别的不同而有所不同，但这一性质在遗漏了交互项的模型中无法得到体现，从而造成OLS估计值产生偏误。2.变量形式误设当模型中一些变量原本应该采用对数形式，而在实际回归过程中却错误地采用了水平形式时，也会导致模型误设，从而造成OLS估计值产生偏误。二、函数形式误设的一般检验（RESET）1.基本思想如果原模型满足MLR.4，那么在回归方程中添加解释变量的非线性关系应该不显著。当解释变量较多时，这么做会产生更多的解释变量，从而损失很大一部分自由度，因此可以考虑在模型中添加被解释变量拟合值的平方项或立方项。估计：y=b0+b1x1+…+bkxk+d1ŷ2+d2ŷ3+u检验：H0：d1=0，d2=0用F统计量或LM统计量进行检验，一个显著的F统计量或者LM统计量说明函数形式可能存在问题2.使用RESET对模型误设检验时应该注意的问题：RESET在探测非线性形式的函数误设时很好用，而不是一般的遗漏变量；Wooldridge在1995年证明：当被遗漏变量的期望值是所包含自变量的线性函数时，RESET无法探测出遗漏变量问题；如果正确设定了模型形式，RESET对检验异方差无能为力；尽管如此，如果被遗漏变量的期望是自变量的非线性形式时，一个显著的RESET可以指出遗漏变量问题；也要注意到，RESET检