第十二章_线性归分析.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章_线性归分析

* * * * * * * * * * * * * * * * * 检验回归方程中的每个解释变量x与被解释变量y之间是否存在显著的线性关系; 确定解释变量能否保留在线性回归方程中。 回归系数的显著性检验 回归系数的检验 (样本统计量 的分布) 是根据最小二乘法求出的样本统计量,服从正态分布; 的分布具有如下性质 数学期望: 标准差: 由于?未知,需用其估计量se来代替得到 的估计标准差 回归系数的检验 (检验步骤) 提出假设 H0: b1 = 0 (没有线性关系) H1: b1 ? 0 (有线性关系) 计算检验的统计量 确定显著性水平?,并进行决策 ? t?t???,拒绝H0;? t?t???,不能拒绝H0 Sig值小于a,拒绝H0 利用回归方程进行估计和预测 根据自变量 x 的取值估计或预测因变量 y的取值 估计或预测的类型 点估计 y 的平均值的点估计 y 的个别值的点估计 区间估计 y 的平均值的置信区间估计 y 的个别值的预测区间估计 第二节 多元线性回归 多元回归模型 (multiple regression model) 一个因变量与两个及两个以上自变量的回归; 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xk 和误差项 ? 的方程,称为多元回归模型; 涉及 k 个自变量的多元回归模型可表示为 b0 ,b1,b2 ,?,bk是参数 ? 是被称为误差项的随机变量 y 是x1,,x2 ,? ,xk 的线性函数加上误差项? ? 是y不能被k个自变量的线性关系所解释的变异性 多元回归模型 (基本假定) 误差项ε是一个期望值为0的随机变量,即E(?)=0; 对于自变量x1,x2,…,xk的所有值,?的方差?2都相同; 误差项ε是一个服从正态分布的随机变量,即ε~N(0,?2),且相互独立; 多元回归方程 (multiple regression equation) 描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,…,xk的方程 多元线性回归方程的形式为 E( y ) = ?0+ ?1 x1 + ?2 x2 +…+ ?k xk b1,b2,?,bk称为偏回归系数 bi 表示假定其他变量不变,当 xi 每变动一个单位时,y 的平均变动值 调整的多重判定系数 (adjusted multiple coefficient of determination) 用样本容量n和自变量的个数k去修正R2得到 计算公式为 避免增加自变量而高估 R2 意义与 R2类似 数值小于R2 线性关系检验 提出假设 H0:?1??2????k=0 线性关系不显著 H1:?1,?2,?,?k至少有一个不等于0 计算检验统计量F 确定显著性水平?和分子自由度k、分母自由度n-k-1找出临界值F ? 作出决策:若FF ?,拒绝H0 回归系数的检验 (步骤) 提出假设 H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi ? 0 (自变量 xi 与 因变量 y有线性关系) 计算检验的统计量 t 确定显著性水平?,并进行决策 ? t?t???,拒绝H0; ? t?t???,不能拒绝H0 多元回归分析中的其他问题 多重共线性 (multicollinearity) 回归模型中两个或两个以上的自变量彼此相关的现象。 多重共线性带来的问题有 回归系数估计值的不稳定性增强; 回归系数假设检验的结果不显著等。 多重共线性检验的主要方法 容忍度 方差膨胀因子(VIF) 容忍度 容忍度 Ri是解释变量xi与方程中其他解释变量间的复相关系数; 容忍度在0~1之间,越接近于0,表示多重共线性越强,越接近于1,表示多重共线性越弱。 方差膨胀因子 方差膨胀因子是容忍度的倒数 VIFi越大,特别是大于等于10,说明解释变量xi与方程中其他解释变量之间有严重的多重共线性; VIFi越接近1,表明解释变量xi和其他解释变量之间的多重共线性越弱。 变量的筛选问题 回归方程中到底引入多少解释变量x 变量的筛选策略 向前筛选策略(Forward); 向后筛选策略(Backward); 逐步筛选策略(Stepwise)。 向前筛选策略(Forward) 解释变量x不断进入回归方程的过程; 首先,选择与y具有最高线性相关系数的变量进入方程,进行回归方程的各种检验; 然后,在剩余变量中寻找与当前解释变量偏相关系数最高且通过检验的变量进入方程; 该过程一直重复,直到用尽所有的自变量。 向后筛选策略(Backward) 变量不断剔除出回归方程的过程; 首先,所有自变量全部引入回归方程,对回归方程进行检验; 然后

文档评论(0)

quechui388620 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档