备课笔记-回归检验.docx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.ttest 二个样本独立T检验use /stat/stata/webbooks/reg/elemapi2ttest api00, by(yr_rnd)Two-sample t test with equal variances2.检查回归模型残差的正态性一般的观点是多元回归要求残差为正态分布。实际情况是,进行回归的有效性检验如t检验的P值、F检验的p值的情况下要求残差是正态性分布的,但回归系数估计的无偏性并不要求残差的正态性。OLS只要求残差项(误差项)独立同分布。此外,对X变量的正态分布假设也不是必要的,例如对虚拟变量的回归。当我们进行回归分析时,通常用 predict 命令提取回归的残差项,并用kdensity, qnorm, pnorm等命令检验残差是否为正态分布。use /stat/stata/webbooks/reg/elemapi2 //api00:学术绩效;ell:英语学习人数;emer:拥有证书的教师比例;regress api00 meals ell emerpredict r, resid //用predict命令求得残差kdensity r, normal //用kdensity命令进行核心密度估计并生成核密度图,其中normal选项要求正态密度和计算的核密度叠加。核密度图可以相像成是一系列无限小的柱状图组合而成。pnorm r //pnorm命令画出标准正态概率图(P-P)。pnorm对数据中段的非正态性非常敏感。qnorm r //qnorm命令画出变量r的分位数(与分位数的正态分布相反)。qnorm对数据两端的非正态性比较敏感。从上面两张图可以看到,残差分布稍微偏离正态分布,接受残差分布为正态分布的假设。除图形检验外,还可以用数值方法检验分布的正态性。其中一个检验程序是由Lawrence C. Hamilton编写的,可以通过finditiqr命令将其从网络中搜寻并安装,或者在Stata中的帮助里查找iqr,找到后击相对应的程序再点击、install。iqr r另一个可用的检验是swilk命令,是Shapiro-Wilk W正态性检验,零假设为正态分布。swilk r从检验结果来看,p值非常大(p=0.51),表明不能拒绝零假设。3.检查残差的同方差(Checking Homoscedasticity of Residuals)OLS的一个主要假设是残差方差是齐次的,即同方差。如果模型拟合较好,残差图和拟合值应该是一致的。如果残差的方差不是常数,意味着残差方差为“异方差”(heteroscedastic)。可以用图形法,或者非图形法检测异方差。较常用的图形法是画出残差与拟合值,即rvfplot命令。rvfplot , yline(0) //yline(0)选项指使用y=0作为参考线。从图上可以看到数据点分布基本均匀,只是右端有点窄,这时可认为是同方差。还有两个命令可以检验同方差,estatimtest和estathettest。第一个是Whites test,第二个是Breusch-Pagan test。二者的零假设均为方差残差是同方差。因此,如果p值非常小,我们拒绝零假设,接受备择假设,即存在异方差。estatimtestestathettest从上面的结果来看,拒绝了同方差的零假设。这两个检验对模型假设非常敏感,因此需要和图形诊断结合起来检验异方差,以及决定是否需要修正异方差。从前面的例子来看,图形分析结果不是很明确。如何修正异方差,则需要用GLS(广义最小二乘法)、FGLS(可行广义最小二乘法)、WLS(加权最小二乘法)估计来解决,或者使用稳健标准差进行回归(Stata的命令是在回归时加上robust参数)。使用“OLS+稳健标准差”时对回归系数和标准差的估计都是一致的,并不需要知道条件方差函数的形式,在Stata中的操作也十分简单,在回归命令reg后加上选择项“robust”即可。从理论上来讲,GLS是BLUE,但FGLS即非线性估计,也不是无偏估计,因此它不是BLUE。FGLS必须先用用样本数据来一致地估计扰动项的协方差矩阵V(X),然后再使用GLS,因此也被称为可行加权最小二乘法(FWLS),有,其中是V的一致估计,此时是数据集(y, x)的非线性函数,因此是y的非线性函数,一般来说是有偏的。FWLS一般用于大样本理论中。FWLS的另一个缺点是必段估计条件方差函数,而通常情况下并不知道条件方差的具体形式,如果该函数的设定不正确,则根据FWLS计算的标准差可能失效从而导致不正确的推断。总之“OLS+稳健标准差”适用于更一般的情形,而FWLS更为有效,因此我们必须在稳健性和有效性之间作出选择。具体来说,如果对V的估计不准确,FWLS估计效果不如“OLS+稳健标准差”。Stock and

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档