- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课程名称: 应用概率.ppt
第三章; ;在实际中这些假定是否合理?如果实际数据与这些假设偏离比较大,那么前面讨论的有关参数的区间估计,假设检验就不一定成立。如果经过分析,已经确认对所研究的具体数据,上面的假设不成立,那么我们又希望探讨对数据作怎样的修正后,能使它们满足或近似满足这些假设。这些就是回归诊断中所要解决的第一个问题。
回归诊断的另一个研究的问题是对数据的诊断,探查对统计推断有较大影响的样本点,这样的点称为强影响点;以及探查与其它数据不是来自同一模型的样本点,这样的点称为异常点。 ;§3.1 残差及残差图;识别、判定和检验异常点。
区分出对统计推断影响特别大的点(影响分析)。
残差分析和残差图能用于研究既定模型与实际数据是否能很好拟合。其中包括:模型线性诊断、模型误差方差齐性诊断、模型误差独立性诊断、模型误差正态性诊断等。
;§3.2 回归诊断一(数据的诊断) ;(一)、数据诊断的两个基本概念;目前对异常点有以下两种较为流行的看法:;;;其次,必须确定“度量影响的尺度是什么?”为了定量地刻划影响的大小,迄今为止已提出多种尺度,基于置信域的尺度,基于似然函数的尺度等等。在每一种类型中又可能有不同的统计量,例如基于影响函数就已提出多种“距离”来度量影响,有Cook距离、Welsch - Kuh距离、Welsch距离等等。每一种度量都是着眼于某一方面的影响,并在某种具体场合下较为有效。这一方面反映了度量影响问题的复杂性,另一方面也说明了影响分析的研究在统计诊断中是一个甚为活跃的方向,还有大量有待解决的问题。;强影响点通常是数据集中更为重要的数据点,它往往能提供比一般数据点更多的信息,因此需引起特别注意。
强影响点和异常点是两个不同的概念,它们之间既有联系也有区别。强影响点可能同时又是异常点也可能不是;反之,异常点可能同时又是强影响点也可能不是。
;(二)、影响分析;§3.3 回归诊断二(模型的诊断);例 3.1;(2)模型修正 为了修改模型,我们再作以 为横坐标的残差图;;模型修改后的残差图;二、 误差方差齐性诊断;三、误差的独立性诊断;判断结果?;判断结果?;四、误差的正态性诊断;回归诊断在SAS上的实现;model y=x/dw r;
选项里加上dw表示计算DW检验的值。
r表示计算学生化残差,并计算Cook距离,若Cook距离相对较大,则认为是强影响点。若学生化残差的绝对值大于2,则可认为是异常点。从学生化残差也可判断误差的正态性假设是否满足。;例子.
给10只大白鼠注射内霉素(30mg/kg)后,测得每只大鼠红细胞x与血红蛋白含量Y数据(见下页SAS文件),试对X和Y进行回归分析。;data mouse;
input x y;
cards;
654 130
786 168
667 143
605 130
761 158
642 129
652 151
706 153
602 151
539 109
;
proc reg;
model y=x;
run;
proc reg;
model y=x/noint dw r cli clm;
plot r.*p.;
run;
;残差图;误差的独立性诊断;第九个为异常点、强影响点
文档评论(0)