- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS相关与回归分析PPT
6.2.3 回归诊断方法 1.用条件数和方差分量来进行共线性诊断 各入选变量的共线性诊断借助SAS的MODEL语句的选择项COLLIN或COLLINOINT来完成。二者都给出数据矩阵的特征根和条件数(Condition Number),还以百分数的形式给出各变量的方差在各主成分上的分解(Decomposition),每个入选变量上的方差分量之和为1。COLLIN和COLLINOINT的区别在于后者对模型中截距项作了校正。当截距项有显著性时,看由COLLIN输出的结果;反之,应看由COLLINOINT输出的结果。 1) 条件数 2)方差分量 2.用方差膨胀因子来进行共线性诊断 1)容许度(Tolerance,MODEL语句斜杠后的选项为TOL) 对一个入选变量而言,其容许度等于1-R2,这里R2是把该自变量当作因变量对模型中所有其余回归变量的决定系数, R2大(趋于1),则1-R2=TOL小(趋于0),容许度差,该变量不由其他变量说明的部分相对较小。 2)方差膨胀因子(VIF) VIF=1/TOL,该统计量称为“方差膨胀因子”(Variance Inflation Factor)。对于不好的试验设计,VIF的取值可能趋于无限大。VIF达到什么数值就可认为自变量间存在共线性,尚无正规的临界值。[陈希孺、王松桂,1987]根据经验得出:VIF>5或10时,就有严重的多重共线性存在。 6.2.4 用各种回归方法筛选变量 6.3 直线回归分析 6.3.1 概述 1.回归分析中安排重复试验的目的 2.重复试验数据的收集与格式 3.重复试验数据的回归分析方法 1)建立直线回归方程 2)回归方程拟合效果的检验 6.3.2 可直线化的简单曲线拟合 2.曲线拟合的基本步骤 曲线拟合的基本步骤可概述如下: 首先画出(x,y)的散点图,根据散点图的变化趋势,并结合常见曲线图形的形状和专业知识,初步选定几种最可能的曲线类型; 根据所选定的曲线方程的特点,作相应的变量变换,使曲线直线化; 建立直线化后的直线回归方程,并作显著性检验; 将变量还原,写出用原变量表达的曲线方程; 若对同一批资料拟合了几个可能的模型,需作曲线的拟合优度检验,看它们在描述同一批资料上是否有显著差别; 对拟合得最好的曲线方程作残差分析,考察所拟合的曲线回归方程在专业上是否成立,是否值得应用。 6.3.3 应用举例 data data_prg.reg6_6a; set data_prg.reg6_6; x11=x1*x1;x22=x2*x2;x33=x3*x3; run; proc reg data=data_prg.reg6_6a; model y=x1-x3 x11 x22 x33/selection=stepwise ; model y=x1-x3 x11 x22 x33/selection=b noint; model y=x1-x3 x11 x22 x33/selection=f noint; model y=x2 x22 x33/selection=stepwise noint r cli influence collin ; run; quit; 程序说明:按对数曲线方程和幂函数曲线方程分别求出各点上y的估计值yhat1和yhat2、残差resid1和resid2、残差平方和scrs1和scrs2。使用PLOT过程将原始数据与预测值绘在一张图上。 6.3.4 一般多项式曲线拟合 程序说明:用DATA步建立新变量:x2、x3分别为x对数的二次方和三次方,在MODEL语句中将这两个新变量加入,用逐步回归法重新拟合对数曲线,将预测值和残差值输出到数据集reg6_10out中,然后用PLOT过程将预测值与原始数据绘制在一张图上,从图形上可以较直观地比较预测值的效果好坏。首先我们使用下面这条MODEL语句进行模型拟合: model y=x1 x2 x3/selection=stepwise P cli R ; 由输出结果发现截距项在模型中不显著(输出省略),所以添加上NOINT选项,去掉模型中的截距项重新拟合。 6.4 非线性回归过程NLIN 6.4.1 NLIN过程简介 PROC NLIN 选择项 ; MODEL 因变量=自变量表达式 ; PARAMETERS或PARMS 参数=数值 …… 参数=数值 ; BY 语句 ; BOUNDS 语句 ; (参数约束语句) DER 语句 ; (微商语句) OUTPUT OUT=SAS数据集,KEYWORD
文档评论(0)