- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
多重共线性VIF值容差SPSSAU
共线性分析
共线性是指信息具有重叠关系,比如X1为身高,X2为体重,二者具有一定的信息重叠,身
高和体重都可以表示身体的轮廓情况。当共线性问题过于严重时,比如某两项之间相关系数大于
0.8甚至0.9时,那么进行某些分析(尤其是回归分析,比如线性回归,二元logit回归等等各类
回归研究方法时)时,会对模型带来影响,严重情况时会导致模型无法拟合出结果。因而应该重
视共线性问题。
通常情况下,共线性问题的表现是两两项之间具有高度的相关关系,比如相关系数大于0.8。
还有一种情况是绝对的共线性,即二者相关系数值为1,即信息具有绝对的重叠性,比如类别数
据进行哑变量处理后,并没有少放一个参照项到模型中,即会导致模型出现异常等。
‘哑变量处理’对应链接:/front/spssau/helps/otherdocuments/dummy.html
共线性问题分析的判断标准上,通常有两种,分别是Pearson相关系数和VIF法。二者的数
学原理均是判断信息重叠情况,但二者出来分析出来的结论可能并不相同。如果是Pearson相关
系数法,通常以其绝对值大于0.8作为标准,如果是VIF值法,通常以VIF值10作为判断标准。
本文档出于演示需要,首先准备一份数据,共有10个X,1个Y,并且进行二元Logit回归。
操作如下图所示:
第1次操作时,SPSSAU提示数据质量异常。猜测很可能有共线性问题等,但当前共有10个
X和1个Y,具体共线性问题是什么并不知道,因而使用共线性分析。操作如下图所示:
提示:
✓关于共线性标准这个参数,SPSSAU默认以Pearson相关系数绝对值0.8作为共线性标
准,并且进行智能分析和共线性项标识。
✓当发现模型(比如二元logit回归等各类回归方法)出问题时,建议将所有的分析项,
一次性放入‘共线性分析’对应的分析框中,并且越重要的分析项放在越前面,比如当
前有1个Y和10个X,Y是最重要的,因而将其放在最前面,10个X依次放入即可。
放置顺序不同,会影响到SPSSAU提供的智能分析建议也跟着变化。
最终共线性分析后得到下图:
Pearson相关系数
平均值标准差YX1X2X3X4X5X6X7X8X9X10
Y0.480.5051
X10.40.4950.0331
X20.60.495-0.033-1.000**1
X30.280.4540.0250.673**-0.673**1
X40.320.4710.0270.753**-0.753**0.814**1
X50.10.3030.2140.136-0.1360.0890.0571
X60.380.490.1550.707**-0.707**0.705**0.876**0.426**1
X70.50.505-0.400**000.08900.0670.0411
X80.40.4950.0331.000**-1.000**0.673**0.753**0.1360.707**01
X90.680.471-0.113-0.403**0.403**-0.718**-0.540**-0.057-0.435**0.086-0.403**1
X1034.825.994-0.565**-0.0
文档评论(0)