多重回归分析.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用于分析一个应变量与多个自变量之间的线性关系的研究方法 第一节 多重线性回归分析 (multiple linear regression ) 一、多重线性回归模型 如果因变量Y与自变量X1、X2、…、Xm 间存在有如下线性关系,则有: 满足的条件 应变量Y与自变量X1、X2、…、Xi、…、Xm之间具有线性关系; 残差 ,即要求对任意一组自变量X1、X2、…、Xi、…、Xm值所对应的应变量Y应相互独立、服从正态分布、方差相等。 二、多重线性回归分析的一般步骤 多重线性回归方程的建立 例13-1测量了30名中学生的身高X1(cm)、体重X2(kg)、胸围X3(cm)、坐高X4(cm)与肺活量Y(L),数据见表13-2 。试对Y与X1、X2、X3、X4做多重线性回归分析。 多重线性回归方程的假设检验 总体模型的假设检验 偏回归系数的假设检验 总体模型的假设检验 偏回归系数的假设检验 标准化偏回归系数的概念* 由于各自变量Xi一般具有不同的单位,不能直接通过偏回归系数的绝对值大小来比较各自变量Xi对应变量Y的影响大小。此时可通过对原始数据的标准化变换: 用所有已经没有单位的数据计算拟合得到的回归方程称为标准化回归方程,相应的偏回归系数称为标准化偏回归系数。标准化偏回归系数绝对值越大说明相应的自变量对Y的作用越大。 SAS程序中加stb选项可求出标准化偏回归系数 三、变量的相关分析 多重线性回归是分析一个应变量与多个自变量之间的线性数量关系,要求应变量服从正态分布。当所有变量都服从正态分布即多元正态分布情况下,可以分析多个变量间的相关关系。 相关分析常用的统计指标有 简单相关系数( simple correlation coefficient ) 偏相关系数(partial correlation coefficient) 复相关系数( multiple correlation coefficient) 决定系数( determination coefficient) 校正决定系数( Adjusted determination coefficient) 简单相关系数 偏相关系数* 将其它诸因素固定来考察两变量Xi、Xj之间的相关关系,这种相关关系可以用偏相关系数 如考察Y、X1、X2三个变量间的偏相关关系可用下式计算各偏相关系数: Y与Xi之间的偏相关系数的假设检验与多重回归分析中的偏回归系数的假设检验结果是相等价的。 应变量Y与自变量间的简单相关系数 与偏相关系数比较 复相关系数* 决定系数* 表示应变量Y的总变异中可由回归方程中自变量的组合解释的部分占总变异的比重,0≤R2≤1。决定系数可做为表示多重线性回归模型拟合好坏的优良性指标,其值越接近1,说明拟合得越好。 校正决定系数 由于计算的样本的决定系数总是大于理论上的决定系数,因此需对其进行校正,得到校正决定系数 校正决定系数更适于作为表示多重线性回归模型拟合好坏的优良性指标,其值越接近1,说明拟合得越好。 四、多重线性回归模型的诊断 数据条件的满足诊断/异常值的诊断 共线性诊断 是否满足数学条件/异常值的诊断 残差分析: 在拟合后对模型是否满足数学条件/或是否有强影响点,常采用残差分析 在SAS软件中记为RESIDUAL,其标准误记为STDERR。它是有量纲的,其单位与应变量Y是相同的。为消除单位进行标准化变换,即用残差除以它的标准误所得的商称为学生氏残差(Studentized Residual),简记为STUDENT.,黑点“.”不可省略。因此可用学生氏残差STUDENT.作为纵轴变量,应变量的估计值 (SAS软件中记为PREDICTED)为横轴变量绘制出散点图,散点应均匀对称地分布在纵轴变量等于0的上下,表示模型是合理的。 残差散点示意图解释 强影响观测点的诊断 检查样本是否存在有强影响的特殊的观测点。 强影响观测点的处理 对寻找到的对回归有较大影响的观测,不应该是简单的将其剔除,而应复查原始数据是否有误, 或增大样本容量再拟合,或改变拟合的模型,或剔除后重新拟合,要仔细分析,结合专业知识进行合理的处理。 若要剔除某个观测数据,应给出其被剔除的理由,并在报告中讨论所得到的结论的局限性及可能的例外。 共线性(collinearity)诊断 共线性:各自变量X1、X2、…、Xi、…、Xm之间不是独立的因素变量,即彼此间有强的相关关系存在,其中某个自变量可以通过其它的自变量来表达,叫作存在共线性,它会增加所拟合的回归方程的方差而造成结果的不稳定性,甚至有时无法得出合理的结果。 诊断方法: 相关分析 (r0.7)

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档