自变量共线性和VIF逐步筛查-EmpowerStats.PDFVIP

自变量共线性和VIF逐步筛查-EmpowerStats.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自变量共线性和VIF 逐步筛查 在构建多元回归方程时,如果一组自变量存在共线性,即变量之间的相关性 过大,可以使得模型估计失真。 一个简单的方法来确定解释变量之间的共线性是利用方差膨胀因子(VIF)。 计算某变量的 VIF:首先构建一个线性回归方程,用所有其它变量解释该变量。 如一组自变量:X1、X2、X3…,构建X1 的线性回归方程: X1 = X2 + X3 + …… 取该方程的R-平方值,然后计算VIF = 1/ (1-R 平方) 同理,计算X2 的VIF,首先构建方程: X2 = X1 + X3 + …… VIF 计算简单,容易理解; VIF 值越高,共线性越高。通常 VIF 5 (或10) 是可以接受的。 本模块,对一组自变量的共线性,根据VIF 进行诊断筛查。筛查方法是: 首先计算每个变量的 VIF, 如果最大的VIF 值=5 (默认的筛查标准),剔 除最大VIF 的变量,重复上步,直到剩下的所有变量的VIF 小于筛查标准。 例1. 自变量共线性导致模型估计失真。使用软件自带的demo 数据,对SBP 进 行回归分析, 结果如下: 模型1: SBP ~ AGE+HEIGHT+WEIGHT+BMI+OCCU.NEW+factor(EDU.NEW)+SEX 广义线性模型 结局变量: Systolic BP, mmhg 变量分布与联系函数: gaussian Estimate Se t value 95%CI.low 95%CI.upp P.value (Intercept) 67.9114 126.8002 0.5356 -180.617 316.4397 0.5924 AGE 0.7837 0.0588 13.3312 0.6685 0.8990 0.0000 HEIGHT 19.2738 80.1343 0.2405 -137.7895 176.3371 0.8100 WEIGHT -0.5046 1.1682 -0.4319 -2.7943 1.7852 0.6659 BMI 2.0144 2.9115 0.6919 -3.6922 7.7209 0.4892 OCCU.NEW -4.7628 1.4687 -3.2429 -7.6415 -1.8842 0.0012 factor(EDU.NEW)2 0.0945 1.9300 0.0489 -3.6884 3.8773 0.9610 factor(EDU.NEW)3 0.7773 2.3174 0.3354 -3.7648 5.3194 0.7374 SEX -4.5227 2.2005 -2.0552 -8.8357 -0.2096 0.0402 AIC: 6949.8292 Log Likelihood: -3464.9146 , df= 10 Null.deviance 402859.2183 on 787 degrees of freedom deviance 304315.5805 on 779 degrees of freedom 19.6641 (pearson chi-square normality test residuals SD P= 0.0001 ) R-squared 0.2446 Adj R-squared 0.2369 Number of observations 788 used: 模型2:SBP ~ AGE+HEIGHT+BMI+OCCU.NEW+factor(EDU.NEW)

文档评论(0)

suijiazhuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档