网站大量收购独家精品文档,联系QQ:2885784924

用SAS作回归分析 Regression AnalysisPPT.ppt

  1. 1、本文档共92页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用SAS作回归分析 Regression AnalysisPPT

回归诊断 例外值(outliers)或异常作用点的检查 从已拟合回归的数据中分析线性模型的假定是否被破坏: 应变量的均值是否是独立变量的线性函数,是否 需要对变量进行变换或拟合曲线回归 余差(residuals)是否同方差,不相关,正态分布 独立变量间是否存在线性关系(仅多元有) 考察余差散点图是进行回归诊断的必要步骤 回归诊断 回归诊断 Ascombe’s 例 Ascombe’s例 Insight: dst.ascombe reg228编程作4图合一 reg228,1-4分别作图 reg222,1-3编程分析 A:x1,y1, I:x1,y2, O:x1,y3, H:x2,y4 回归诊断 回归分析的余差值是回归诊断的重要工具 利用余差可以考察余差和预测值的散点图 也可以检验余差分布的正态性 回归诊断 模型合适 应改曲线模型 不等方差 观测值不独立 回归诊断 生成余差 在INSIGHT中拟合回归后在数据表中回自动 生成预测值、余差值和余差-预测散点图 回归诊断 生成余差 Analyst: Statistics ? Regression? Linear . . . ? Predictions预测值、余差值 回归诊断 Insight: Cars Var ? Std res., 找绝对值超过2者 var ? Cook’s D 超过 4/92=0.04348 var ? Dffits 超过 2sqrt((k+1)/n)=0.58977 参数估计表中看vif output+collinearity…看条件指数与方差比例 Analyst: Cars +p.,r.,student to dst +plot: std.*p. +cookd 0.0435, dffits 58977 +statisitcs ? tests Collinearity, vif 回归诊断 生成余差 在PROC REG的model语句加上选项 p,就会 输出预测值和相应的余差 PROC REG DATA=数据集名 graphics ; MODEL 应变量=自变量/p; PLOT y变量*x变量/选项; symbol n c=颜色 v=值; RUN; 利用plot语句 plot r.*p. ; 就可得到余差- 预测散点图 回归诊断 识别异常观测值 回归诊断 识别异常观测值 在PROC REG的model语句加上选项 r,就会 输出与预测值和余差有关的一些统计量。他 们可用于识别异常数据(outlier)及其影响 PROC REG DATA=数据集名 ; MODEL 应变量=自变量/r; RUN; Predict Value 预测值 Std Err Predict 预测值标准差 Residual 余差 Std Err Predict 余差标准差 Student Residual student化的余差 -2 -1 0 1 2 余差显著性图 Cooks D Cooks D统计量 与余差有关的统计量 回归诊断 余差分布正态性 有了余差的数据,就可对其运用图形方法 或正式的分布正态性的检验 在INSIGHT中可直接对数据表中的预测余 差变量进行分析 在PROC REG可利用下列语句用图形分析 余差分布正态性 PROC REG DATA=数据集名 graphics ; MODEL 应变量=自变量; PLOT nqq.*student.(nqq.*r.); RUN; 回归诊断 识别有影响的观测 回归诊断 识别有影响的观测 Cook D统计量度量一个观测从分析中剔除 时参数估计值的变化 对一个观测值其 Cook D 统计量的值超 过 4/n 时(n为样本容量),这个观测存在 反常效应 SAS/INSIGHT 在下拉菜单选 Var ? Cooks D 回归诊断 识别有影响的观测 Dffitsi 度量第i 个观测对预测值的影响 第i个观测的预测值 用排除第i个观测的回归对第i个观测的预测值 第i个观测的预测值的标准差 p 为模型中参数的个数, n 为样本容量 SAS/INSIGHT 在下拉菜单选Var ? Dffits 回归诊断 识别有影响的观测 Analyst: Statistics ? Regression? Linear . . . ? Save Data 回归诊断 识别有影响的观测 Proc REG 的 Model语句加选项 r 可获得 Cook D 统计量 Proc REG 的 Model语句加

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档