多因素分析共线性问题及处理办法(刘桂芬版).pptVIP

多因素分析共线性问题及处理办法(刘桂芬版).ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
LOGO * LOGO 2009级研究生选修课 多因素统计分析方法 开课教研室:流行病学与卫生统计学教研室 主讲教师:黄高明 黄志碧 选修课:多因素统计分析方法 多因素分析中共线性问题及其处理方法 如方程中某些自变量彼此相关,即存在共线性问题。共线性问题会使回归方程迭代结果不稳定,结果不好解释。 有以下症状体征,即表示存在共线性: (1)整个方程的方差分析结果Pα,但各自变量的偏回归系数的检验结果却pα。 (2)专业上认为应该有意义的自变量,检验结果却无统计学意义。 (3)自变量的偏回归系数取值大小甚至符号与实际不符,难以解释。 (4)增加或删除某个自变量,其他自变量的偏回归系数变化较大。 多因素分析中共线性问题及其处理方法 体重指数=体重(kg)/[身高(m)]2 2.32 19.5 41.8 146.5 2.39 20.5 48.8 154.2 2.75 24.7 61.8 158.2 2.42 21.1 51.9 156.8 2.29 22.3 48.1 146.8 2.64 19.1 51.2 163.6 2.03 17.3 33.8 139.8 1.85 15.6 28.5 135.1 肺活量(y) 体重指数(x3) 体重(x2) 身高(x1) 8名学生身体测量数据 多因素分析中共线性问题及其处理方法 实例1 相关分析 实例1 多因素分析中共线性问题及其处理方法 多元回归分析 实例1 逐步回归分析 实例1 共线性诊断 下页的参数自动出来 二、共线性问题判断之SPSS软件分析 (分析具体是哪个变量造成共线性) SPSS共线性诊断常用的参数有: ( Collinearity Diagnostics) 容许度(Tolerance):越小,越严重。(标准:0.1) 方差膨胀因子(variance inflation factor, VIF):是容许度的倒数。越大,越严重。(标准:5) 特征根(Eigenvalue):越小,越严重。 条件指数(Condition Index):越大,越可能性越大。(标准:30) 变异构成(Variance Proportion):(标准:0.5) 二、共线性问题判断之SPSS软件分析 ★容许度(Tolerance) ※只有2个自变量时, 越接近1,共线性越强。 ※有多个自变量时:有任意某个自变量xi与其他自变量之间的复相关系数的平方来表示。称为 它的值越接近于1,说明自变量之间的共线性程度越大。 容许度:Toli=1- 二、共线性问题判断之SPSS软件分析 ★VIF(方差膨胀因子):它是容许度的倒数 定义: 意义:取值越大,自变量之间存在共线性的可能性越大。 ★条件参数(Condition Index): (越大,共线性可能性越大) 二、共线性问题判断之SPSS软件分析 ★特征根(Eigenvalue):越小,越严重。 ★变异构成(Variance Proportion):(标准:0.5) 二、共线性问题判断之SPSS软件分析 30,提示有共线性 变异构成。0.5可能有共线性 实例1 特征根越小共线性越严重 二、共线性问题判断之SPSS软件分析 贡献率。0.5可能有共线性 30,提示有共线性 二、共线性问题判断之SPSS软件分析 主成份 例15的结果 三、解决共线性问题的办法 1. 剔除变量法 把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。 ——不幸的是,有时,去掉总体模型中的一个变量就会导致偏误。 (一)修正多重共线性的经验方法 2. 增大样本容量 如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。 问题:增加样本数据在实际计量分析中常面临许多困难。 三、解决共线性问题的办法 3. 变量变换 变量变换的主要方法: (1)计算相对指标(标准化变换) (2)将名义数据转换为实际数据(高中低 具体数据) (3)将小类指标合并成大类指标 ——化成某种综合指数(主成份) 变量数据的变换有时可得到较好的结果,但无 法保证一定可以得到很好的结果。 三、解决共线性问题的办法

文档评论(0)

iris + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档