-多重线性回归.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
-多重线性回归.ppt

* 三、分析步骤 2.7 异常点诊断 2.7.1 异常点 对因变量的预测值影响特别大,甚至容易导致相反结论的观测点,称为异常点。 异常点的诊断,可采用学生化残差统计量、Cook’s D统计量。 * 三、分析步骤 2.8 自变量作用大小评价 由于自变量量纲不同,不能直接根据原始数据计算得来的偏回归系数来评价各自变量对因变量的影响大小。 也不能依据P 值来判断自变量对因变量的影响大小。因为P 值的大小,不表示自变量的影响强弱,仅表示认为它有影响的可能性有多大。 * 三、分析步骤 2.8 自变量作用大小评价 先对原始数据进行标准化变换,然后再计算偏回归系数,此时的偏回归系数称为标准化偏回归系数。 标准化偏回归系数绝对值越大,说明该自变量对因变量的影响越大。 自变量的标准差 因变量的标准差 * 三、分析步骤 2. 具体步骤 2.3 参数检验 第二步,计算检验统计量。 * 三、分析步骤 2. 具体步骤 2.3 参数检验 第三步,确定P值。 根据自由度和临界水平,查t分布表,可得双侧界值为ta/2(n-k-1)。 * 三、分析步骤 2. 具体步骤 2.3 参数检验 若t ta/2(n-k-1)或t - ta/2(n-k-1),则Pa。此时,拒绝H0,接受H1,认为该回归系数不等于0。反之,则接受H0,认为该回归系数为0。 * 三、分析步骤 2. 具体步骤 2.4 变量筛选 由例1的分析结果可知,不是所有的自变量对因变量的作用都有统计学意义。 故需要找到一个较好的回归方程,使之满足:方程内的自变量对回归都有统计学意义,方程外的自变量对回归都无统计学意义。 * 三、分析步骤 2. 具体步骤 2.4 变量筛选 这就是自变量的选择问题,或称为变量筛选。选择时, 一要尽可能地不漏掉重要的自变量; 二要尽可能地减少自变量的个数,保持模型的精简。 * 三、分析步骤 2. 具体步骤 2.4 变量筛选 常用的变量筛选方法有以下8种: 前进法 后退法 逐步回归法 最大R2增量法 最小R2增量法 R2选择法 修正R2选择法 Mallow’s Cp选择法 * 三、分析步骤 2.4.1 前进法(FORWARD) 回归方程中变量从无到有依次选择一个自变量进入回归方程,并计算该变量对应的F统计量及P值。 当P小于纳入标准(规定的选变量进入方程的临界水平),则该变量入选,否则不能入选。 * 三、分析步骤 2.4.1 前进法 当回归方程中变量少时某变量不符合入选标准,但随着回归方程中变量逐次增多时,该变量就可能符合入选标准;这样直到没有变量可入选为止。 具体而言,是从仅含常数项(即截距项)的最简单模型开始,逐步在模型中添加自变量。 * 三、分析步骤 2.4.1 前进法 局限性: 纳入标准取值小时,可能没有一个变量能入选; 纳入标准取值大时,开始选入的变量后来在新条件下不再进行检验,因而不能剔除后来变得无统计学意义的变量。 * 三、分析步骤 2.4.2 后退法(BACKWARD) 从模型中包含全部自变量开始,计算留在回归方程中的各个自变量所产生的F统计量和P值,当P值小于排除标准(规定的从方程中剔除变量的临界水准)则将此变量保留在方程中。 * 三、分析步骤 2.4.2 后退法 否则,从最大的P值所对应的自变量开始逐一剔除,直到回归方程中没有变量可以被剔除时为止。 * 三、分析步骤 2.4.2 后退法 局限性: 排除标准大时,任何一个自变量都不能被剔除;

文档评论(0)

000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档