回归分析回归诊断.pptx

  1. 1、本文档共120页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

回归模型诊疗;经过简单回归和多元回归模型能够有了计算结果。

这些结果能做推断,需要建立在一些概述性统计量基础之上,这些统计量由数据来计算。而只有当标准回归假定满足时,所做推断才有可能是合理,有意义。而对假定核定,能够用图形方法,也能够用严格数值去检验。

数据也需要考虑

还有模型设定;;标准回归假定:;数据诊疗

异常值

强影响点

假定是否满足

模型诊疗

;6;异常点识别与处理,是统计诊疗中很主要一项内容。

异常点出现会影响分析结果可信度。

异常点存在往往蕴涵着主要信息。

在有些情况下,异常点出现是因为有新事物出现或者新情况发生,比如经济模型中某种经济政策出台等,都能表现出异常,这通常是我们研究兴趣所在。;在另外一些情况下,异常点出现是因为人为差错或者仪器故障所引发。

在我们需要依据样本对模型进行参数预计或者依据模型对未来进行预测与控制时候,异常点出现会对我们工作产生很强影响,这么结果是令人怀疑。

所以,异常点研究受到了广大研究者重视,自Bernoulli首次提出了异常点概念,接下来对异常点概念、类型以及处理问题讨论一直没有停顿过。;异常点成因与处理;;;回归系数普通采取“最小二乘预计”(leastsquaresestimator,LSestimator)求解,不过在应用中轻易忽略问题是LS预计只有在数据满足对应条件情况下才会含有统计描述和推断优良性质,如要求误差服从正态分布、总体方差相同且相互独立等。

当实际数据没有近似满足这些假定时,就会出现一些异常点(outliers)、杠杆点(leveragepoint)及影响点(influentialobservations),使分析结果变得不可靠,不能发觉数据中真实结构,从专业上难以解释结果,甚至得到完全错误结论。尤其是伴随统计软件日渐普及,我们倾向于简单地将数据交给软件来分析,而不注意详细方法应用条件,尽管采取了SAS、SPSS这些国际标准软件,不过输出结果有时却与专业解释相悖。;异常点在统计诊疗中地位;回归分析回归诊断;;;;异常值有时一个,有时多个;;;残差;残差;;强影响点;;;;;;;;数据集中强影响点是指那些对统计量取值有非常大影响力点??在考虑强影响点时,有几个基本问题需要考虑:

首先必须明确“是对哪个统计量影响?”比如,对线性回归模型所考虑是对回归系数预计量影响;不是对误差方差预计影响;或是对拟合优度统计量影响等等。分析目标不一样,所考虑影响亦有所不一样。

;其次,必须确定“度量影响尺度是什么?”为了定量地刻划影响大小,迄今为止已提出各种尺度,基于置信域尺度,基于似然函数尺度等等。

在每一个类型中又可能有不一样统计量。每一个度量都是着眼于某首先影响,并在某种详细场所下较为有效。这首先反应了度量影响问题复杂性,另首先也说明了影响分析研究在统计诊疗中是一个甚为活跃议程。

;;有影响观察值

(图示);有影响观察值

(图示);有影响观察值

(图示);有影响观察值

(图示);有影响观察值

(图示);;;;;;;但看标准化残差看不出来;残差图也看不出来;杠杆值序列图能够看出来了;;我们还需要相关度量指标;;影响各种度量;;;;;经过图显示强影响点;;;图形方法;图形方法作用;图形;一维图;二维图;;;;;;旋转图;怎样处理异常点?;图中是XY两个变量散点图,数据主体显示了X与Y之间某种线性关系。但右上角22和23两个点是异常值。假如这两个点是正确,那么它们则是数据集中仅有、显示着这批数据可能服从某种非线性模型观察。

我们把这想象为一个细菌群体,它在异端时间内最终非常迟缓,但过了某个时间临界点之后,快速增加。;一旦判别出了异常点和强影响观察后,怎样处理呢?

因为异常点和强影响观察可能是数据集中信息最丰富观察,因而不应该不加说明、自动地抛弃它们。相反,应该经过考查,判断它们为何是异常或强影响点。

依据这些考查才可能采取适当、正确办法

正确办法包含:更正数据中错误、删除异常点或降低他们权重、变换数据、考虑不一样模型、重新搜集或补充更多数据。;模型误设及其后果;设Y=?0+?1X1+v(*)

为正确模型,但却预计了

Y=?0+?1X1+?2X2+?(**);因为全部经典假设都满足,所以对

Y=?0+?1X1+?2X2+?(**)

式进行OLS预计,可得到无偏且一致预计量。;;;采取遗漏相关变量模型进行预计而带来偏误称为遗漏相关变量偏误。;将正确模型Y=?0+?1X1+?2X2+?离差形

您可能关注的文档

文档评论(0)

150****5008 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档