《回归分析回归诊断》ppt课件模板.pptVIP

下载本文档

6
0
约1.02万字
约 127页
2021-08-29 发布于广东
举报
版权申诉

《回归分析回归诊断》ppt课件模板.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

例:建立了中国商品进口M与GDP的一元线性关系: 并发现具有强烈的一阶自相关性。序列相关性的主要原因之一可能就是建模时遗漏了重要的相关变量造成的。下面进行RESET检验。 R2=0.9484 （-0.085）（8.274）（-6.457）（6.692） R2=0.9842 在?=5%下，查得临界值F0.05(2, 20)=3.49 判断：拒绝原模型与引入新变量的模型可决系数无显著差异的假设，表明原模型确实存在遗漏相关变量的设定偏误。（3）同期相关性的豪斯蔓（Hausman）检验由于在遗漏相关变量的情况下，往往导致解释变量与随机扰动项出现同期相关性，从而使得OLS估计量有偏且非一致。因此，对模型遗漏相关变量的检验可以用模型是否出现解释变量与随机扰动项同期相关性的检验来替代。这就是豪斯蔓检验的主要思想。当解释变量与随机扰动项同期相关时，通过工具变量法可得到参数的一致估计量。而当解释变量与随机扰动项同期无关时， OLS估计量就可得到参数的一致估计量。因此，只须检验IV估计量与OLS估计量是否有显著差异来检验解释变量与随机扰动项是否同期无关。对一元线性回归模型 Y=?0+?1X+? 所检验的假设是 H0：X与?无同期相关。设一元样本回归模型为以Z为工具变量，则IV估计量为： (*) (*)式表明，IV估计量与OLS估计量无差异当且仅当?ziei=0，即工具变量与OLS估计的残差项无关。检验时，求Y关于X与Z的OLS回归式：在实际检验中，豪斯蔓检验主要针对多元回归进行，而且也不是直接对工具变量回归，而是对以各工具变量为自变量、分别以各解释变量为因变量进行回归。如对二元回归模型通过增加解释变量的F检验，检验联合假设： H0：?1=?2=0 。拒绝原假设，就意味着（*）式中的解释变量与随机扰动项相关。 (*) 模型设定的方法之”从一般到简单” 作为建模起点的总体模型必须能够包容所有经过约化得到的“简洁”的模型。它应该包含所有对被解释变量产生影响的变量，尽管其中的某些变量会因为显著性不高或者不满足正交性条件等原因在后来的约化过程中被排除。图形方法图形方法在数据分析中起着重要的作用,在对数据拟合线性模型时,图形方法尤其重要. 没有哪种统计工具能象一张精选出来的图形一样有威力. 图形方法可以被视为探索性的工具,同时也是验证分析或统计推断不可缺少的一部分. 图形方法的作用 1.发现数据中的错误(如印刷错误) 2.辨别数据中的模式(如密集群,异常点,明显的差距等) 3.探索变量间的关系 4.发现新现象 5.确认或否认各项假定 6.评价拟合的模型是否充分 7.建议修正措施(例如数据变换,收集更多的数据等) 图形 1.一维图（看变量的分布） 2.二维图 3.旋转图 4.动态图一维图直方图茎叶图点图箱线图二维图我们希望图中的各散点图看上去是怎么样的呢?对于简单回归,我们预期Y与X之间呈现某种直线模式,但对于多元回归,Y与各自变量之间的散点图可能呈直线状.在线性模式较为肯定的场合,这些散点图的非线性状态并不说明线性模型不正确. 应同时依赖于各个预测变量而不是单个从上面的二维图看到,Y与X1之间,Y与X2之间都不存在线性关系,然而作Y关于X1和X2两个变量的回归时,拟合程度几近完美. 我们假定预测变量之间是线性无关的,所以预测变量对散点图不应该呈直线状,更理想地,我们希望从中看不出任何可辩识的模式.无论是线性的还是非线性的.但是上面例中,该假定是不成立. 因为X1和X2有明显的线性关系. 当然这些散点图不呈直线状还不能说明全部变量间的线性无关的,因为线性关系可能存在与多个预测变量之间. 旋转图如何处理异常点? 异常点和强影响观测值不应该机械被删除或自动降低权重,因为他们不一定是坏的观测。相反，如果它们是准确的，它们就可能是数据中含信息最多的点。比如，他们可能指出数据并非来自正态总体，或者模型不是线性的，我们看下例中的数据看异常点及强影响点可能是数据中含信息量最多的点。图中是XY两个变量的散点图，数据主体显示了X与Y之间的某种线性关系。但右上角的22和23两个点是异常值。如果这两个点是正确的，那么它们则是数据集中仅有的、显示着这批数据可能服从某种非线性模型的观测。我们把这想象为一个细菌的群体，它在异端时间内最后的非常缓慢，但过了某个时间的临界点之后，迅速增长。一旦鉴别出了异常点和强影响观测后，如何处理呢？因为异常点和强影响观测可能是数