- 22
- 0
- 约1.41万字
- 约 89页
- 2018-05-18 发布于四川
- 举报
回归诊断的方法 复验数据,确认有无数据输入错误发生; 若数据有效,则模型可能不适合,可考虑使用高阶模型; 对于有效但可能反常的数据,可考虑增加样本容量以验证现有的拟合结果; 因为某些有影响观测可能包含重要信息,不能轻易将其剔除,若要剔除,也应给出对剔除观测的描述和说明。 对于例外观测或强影响观测的处理: 回归诊断的实现 SAS/INSIGHT方式 考察余差 : 对在例4.13中根据数据集sunny.cars建立的midprice对变量cylinder,egnsize,rpm及revltns的回归模型进行诊断。 例4.15 利用Fit(X Y)菜单拟合线性回归,可缺省地提供余差--预测值的散点图,并在数据表中自动生成余差 1. 预测值 余差 SAS/INSIGHT方式 考察余差 : 回归诊断的实现 2. 考察标准化余差 Vars Standardized residual (即可在数据表中加入标准化余差变量RS_ MIDPRICE); Edit Variables Others 在Transforms栏中选Abs(Y),在变量栏Y中选RS-MIDPRICE OK (生成标准化余差的绝对值A_RS_ MID); Edit Observation Find… 将全部标准化余差绝对值大于2的观测挑出来作进一步分析。 在拟合结果窗口的下拉菜单中选: 输出结果: 利用右键弹出菜单中Extract选项生成数据子集: SAS/INSIGHT方式 检测观测对回归的影响--- Cook D 回归诊断的实现 Cook D统计量大于4/n表明是一个强影响点,此处n=92,故要确认其是否大于4/92=0.04348. 分 析 Vars Cook’s D (即可在数据表中加入Cook D变量D_ MIDPRICE); Edit Observation Find… 将全部Cook D统计量大于0.04348的观测挑出来作进一步分析。 在拟合结果窗口的下拉菜单中选: 输出结果: 利用右键弹出菜单中Extract选项生成数据子集: SAS/INSIGHT方式 回归诊断的实现 检测观测对回归的影响--- Dffits Dffits统计量绝对值大于 表明是强影响点,此处n=92,k=4,故要确认其是否大于0.4663. 分 析 Vars Dffits (数据表中加入Dffits变量F_ MIDPRICE); Edit Variables Others 在Transforms栏中选Abs(Y),在变量栏Y中选F-MIDPRICE OK (生成Dffits变量绝对值A_F_ MIDP); Edit Observation Find… 将全部Dffits统计量大于0.4663的观测挑出来作进一步分析。 在拟合结果窗口的下拉菜单中选: 输出结果: 利用右键弹出菜单中Extract选项生成数据子集: SAS/INSIGHT方式 共线性诊断---方差膨胀因子 回归诊断的实现 利用Fit(X Y)菜单拟合线性回归时,方差膨胀因子(VIF)自动包含在拟合窗中,由输出结果可以看出,各变量的方差膨胀因子均小于10,即可认为模型中各自变量间不存在共线性问题。 SAS/INSIGHT方式 共线性诊断---条件指数和方差比例 回归诊断的实现 在拟合结果窗口的下拉菜单中选: Edit Windows Renew… Output Collinearity diagnostics OK. 输出结果: 大于30小于100,可认为变量间有中度相关关系 超过0.5,表明常数项与其它自变量间存在共线性,(一般不轻易剔除常数项) 分析员应用方式 回归诊断的实现 制作余差或标准化余差等的散点图 : 进入linear regression对话窗口选定自变量和因变量 Plots Residual,弹出对话窗口: 输出结果: 分析员应用方式 回归诊断的实现 考察余差及有影响的观测 进入linear regression对话窗口选定自变量和因变量, Save Data,弹出对话窗口: 输出结果(diagnostics table): 预测值 余差 标准化余差 学生化余差 (可将该结果另存为SAS数据集work.diagnostics) 打开数据集work.diagnostics,由data where…,打开选择子集对话框,将标准化余差绝对值大于2,或Cook D统计量大于4/n=0.04348,或Dff
原创力文档

文档评论(0)