- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 标准和检验
第七章 模型选择:标准与检验;本章的主要内容如下:
1.“好的”或者“正确”的模型具有的性质
2.在实践中容易犯哪几种设定误差?
3.各种设定误差的后果是什么?
4.如何诊断设定误差?
5.如果已经犯了设定误差,可以采取哪些补救措施重新回到“正确的”模型。 ;一、“好的”模型具有的性质;二、设定误差的类型;(一)遗漏相关变量:“过低拟合模型”;4.根据两变量模型得到的误差方差是真实误差方差 的有偏估计量。
5.此外,通常估计的 的方差( )是真实估计量方差的有偏估计量。即使 等于零,这一方差仍然是有偏的。
6.通常的置信区间和假设检验过程不再可靠。置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零。
(二)包括不相关变量:“过度拟合”模型
假定正确的模型如下:
而错误设定的“过度拟合”的模型如下:
;过度拟合模型通常会导致如下后果:
1.过度拟合模型的估计两是无偏的(也是一致的)。即:
2.从过度拟合方程得到的 的估计量是正确的。
3.建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的。
4.从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大。因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的。总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量。
比较“过度拟合”和“过低拟合”所导致的后果,可以得到这样一个结论:包括不相关变量比遗漏相关变量要好。但不能简单地认为,增加变量就可以了,因为增加不必要的变量会损失估计量的有效性,也可能导致多重共线性问题,还会损失自由度。;(三)不正确的函数形式
假设有如下两个模型:
首先应该知道的是,如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量。
问题是:如何根据一个样本在这两个模型间进行选择呢?
假如有如下例子:下表给出了1968-1987年美国进口货物的支出(Y)和个人可支配收入(X)的数据。;美国进口货物的支出与个人可支配收入
数据表 1968年-1987年;利用这些数据分别拟合以上两个模型得到:;Dependent Variable: LNY
Method: Least Squares
Date: 11/01/08 Time: 12:06
Sample: 1968 1987
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
C -23.76903 6.939654 -3.425103 0.0032
LNX 3.906223 0.944492 4.135794 0.0007
TIME -0.056435 0.026128 -2.159930 0.0454
R-squared 0.936649 Mean dependent var 5.464374
Adjusted R-squared 0.929196 S.D. dependent var 0.321369
S.E. of regression 0.085513 Akaike info criterion -1.942814
Sum squared resid 0.124312 Schwarz criterion -1.793455
Log likelihood 22.42814 F-statistic 125.6737
Durbin-Watson stat 2.317654 Prob(F-statistic) 0.000000 ;从以上这两个例子的回归结果可知:
所有的回归系数都是统计显著的,而且两个模型的判定系数 都很高。我们无法根据这些因素来判别两个模型的优劣。当然,这些因素都不是区别这两类模型拟合数据优劣的主要标准,因为,在实际应用中有一种专门判别这两类模型拟合数据优劣性的方法。(本章后面的内容会涉及到这个问题)
(四)度量误差
1.应变量中度量误差对回归结果的影响
(1)OLS估计量是无偏的
(2)OLS估计量的方差也是无偏的
(3)估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中。;2.解释变量的度量误差对回归结果的影响
(1)OLS估计量是有偏的
(2)OLS估计量也是不一致的。
解决方法:
如果解释变量中存在度量误差,建议使用工具变
文档评论(0)