和被解释变量.PPT

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
和被解释变量

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 残差的独立性分析 绘制残差序列图:如果残差随着时间的推移呈现有规律的变化,表明残差序列存在一定的正或负的自相关性。 * 计算残差的自相关系数:自相关系数的取值范围在 -1至1之间,自相关系数接近于1表明序列存在正自 相关,接近于-1表明存在负自相关。 计算杜宾(DW)统计量:DW值在0至4之间,当 DW=4时,序列存在完全负自相关;当DW=0时,残差序列完全正自相关;当DW=(2,4)时,残差序列存在负相关;当DW=(0,2)时,残差序列存在正相关;当DW=2时,残差序列无自相关。 * 探测样本中的异常值和强影响点 异常值点:统计数据中与其余数据明显不一致的样本点,也称为离群值。 强影响点:统计数据中对推断统计有较大影响的样本点。 一般y中的离群值称为异常值点,x中的离群值称为强影响点。 * 对被解释y中的异常值探测方法:标准化残差、学生化、剔除残差的绝对值大于3的观察值为异常值。 对解释变量x中异常值探测方法:杠杆值和库克距离。 * 多元线性回归分析中的多重共线性 多重共线性:是指解释变量之间存在线性相关关系的现象。 多重共线性的后果: (1)偏回归系数估计困难 (2)偏回归系数的估计方差随解释变量相关性的增 大而增大 (3)偏回归系数的置信区间增大 (4)偏回归系数估计值不稳定性增大 (5)偏回归系数假设检验的结果不显著 测定共线性的方法: * 复相关系数 概念:是测量一个变量与其它多个变量之间的线性相关程度的指标,取值范围在[0,1]。它不能直接测算,只能采取一定的方法进行间接测算。 在多元回归中,y与所有自变量间的复相关系数是回归方程的决定系数的平方根。 * * 多元回归分析中的三种相关: 零阶相关系数(Zero-Order):计算所有自变量与因变量之间的简单相关系数。 部分相关(Part Correlation)表示:在排除了其他自变量对 xi的影响后,当一个自变量进入回归方程模型后,复相关系数的平均增加量。 偏相关系数(Partial Correlation )表示:在排除了其他变量的影响后;自变量 Xi与因变量y之间的相关程度。 注:部分相关系数小于偏相关系数。偏相关系数也可以用来作为筛选自变量的指标,即通过比较偏相关系数的大小判别哪些变量对因变量具有较大的影响力 * 测度多重共线性的方法: 容忍度: ,其中 是解释变量 与方程其它变量之间的线性相关程度。容忍度的取值范围[0,1],越接近于0,表示多重共线性越强;越接近于1,表示多重共线性越弱。 方差膨胀因子: 。方差膨胀因子的取值大于等于1。通常,如果值大于等于10,说明存在严重的多重共线性。 * 特征根和方差比:从解释变量的相关系数矩阵出发,计算相关系数矩阵的特征根。如果最大特征根的值远远大于其它特征根的值,则说明这些解释变量之间具有相当多的重叠信息。如果某个特征根既能够刻画某解释变量方差的较大部分比例(0.7以上),又能刻画另一解释变量方差的较大部分比例,则表明这两个解释变量间存在较强的线性相关关系。 * 条件指数:是在特征根的基础上定义的反应解释变量方间多重共线性指标,定义式为 是最大特征根与第i个特征根的比的平方根。 ①当条件指数在0-10之间时说明多重共线性较弱; ②当条件指数在10-100之间说明多重共线性较强; ③当条件指数大于100时说明存在严重的多重共线性 * * 多元回归分析中变量筛选策略 1.全回归法(Enter) 所有自变量进入回归方程。优点:一般具有较高回归系数;缺点:对变量无明显影响的自变量也可能进入回归方程。 2.向前法(Forwards) 该方法比较所有自变量与因变量的偏相关系数,然后选择最大的一个作回归系数显著性检验,决定其是否进入回归方程。每次选择一个变量进入回归方程,直到所有符合判别条件的变量都进入模型为止。缺点:“只进不出”。 * 3.向后法(Backward) 该方法首先计算包含所有变量的回归方程,然后用偏F检验逐个剔除对因变量无明显影响的自变量,直到每一个变量在偏F检验下都有显著性结果为止。缺点:“只出不进”。 4.逐步筛选法(Stepwise) 该方法是对“向前法”的改进,既有引入变量也有剔除变量,原来剔除的变量在后面又可能被引入到回归方程中来。它是目前应用较为广泛的一种多元回归方法。 * 所选变量强行进入回归方程 逐步筛选策略 从回

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档