[工学]sas 课件第6讲 SAS系统与回归分析.ppt

[工学]sas 课件第6讲 SAS系统与回归分析

* 回归诊断 识别强影响点--选项 influence 生成的统计量 Cook D统计量的定义为: 其中b(i)表示删除第i个观测后回归系数b的估计量.另一统计量DFFITS定义为: - 回归诊断 识别强影响点--偏杠杆图 偏杠杆图是使有影响观测可视化的方法. 偏杠杆图是两个回归的残差的散点图. 例如对变量 xr 的偏杠杆图: 纵轴是Y关于除xr以外所有x的回归的残差, 横轴是xr关于所有x的回归的残差. 有影响观测通常分离与其它数据点或在某 一轴上有极端数值. 偏杠杆图还可识别要加入哪些变量的高次项. 回归诊断 识别强影响点--生成偏杠杆图 Proc REG 的 Model语句加选项partial 可获得杠杆图(低分辨) PROC REG DATA=数据集名 ; MODEL 应变量=自变量/partial; RUN; (Reg65.sas) 回归诊断 识别强影响点 如何处理有影响的观测: 1.复验数据,确认并无数据输入错误发生; 2.若数据是有效的,模型可能不合适.拟 合此数据可能需要使用高阶模型,也可能数据是反常的; 3.一般不剔除数据.某些有影响的观测提 供重要的信息.若要剔除数据,应给出必 要的描述和说明. 回归诊断 共线性诊断 共线性(collinearity, multicollinearity)问题是指自变量间存在线

文档评论(0)

1亿VIP精品文档

相关文档