多重回归与自变量的筛选方法.ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 逐步回归与自变量筛选方法 一、问题的提出 1. 多元线性回归需对系数作检验,无意义的变量需剔除,由于变量间相关性,其他变量的显著性发生改变 2.从应用和分析目的角度,精选自变量——模型拟合要优、变量节俭 问题:如何选择自变量进入模型? 1. 分析目的;2.建立模型的统计准则是什么?3.结合专业和实际问题考虑 二、自变量筛选的标准与原则 1.残差平方和、残差均方准则 当残差平方和(SSE)最小时,决定系数(R2)达到最大。 n为样本含量, R2 为包含m个自变量的回归方程的决定系数。 R2是随着变量数的增加而增大,而 不受变量数的影响, 4.预测平方和准则(press统计量,预测精度) Press=∑di2 di2=Yi-X‘I X‘i 表示剔除了所要预测的第i观测值以后所剩余观测值所做估计。 5.逐步回归(统计显著性准则) 统计显著性准则:把有统计学意义的变量选入模型,得到的回归模型不一定是最佳预测模型。 三. 逐步回归分析(stepwise regression) 1. 概述 简单地对回归系数作检验,比较复杂; 用前述的几个指标是在所有子集回归中选最优回归模型,而逐步回归是每一步引入或剔除一个变量(其标准是F检验),直到引不进又剔不出为止,建立一个包含所有对因变量有影响的自变量。不是最优回归 二、逐步回归法 方法:向前法(forward )、向后法(backward)、逐步法(stepwise ) 每一步只引入或剔除一个自变量准则,是基于对偏回归平方和的F检验 (1)向前法(forward),回归方程中的自变量是一个个进入的,最有统计学意义的变量最先进入,依此类推。即只进不出。 Y对每一个自变量作线性回归,计算各自变量的偏回归平方和,选取偏回归平方和最大者作F检验,有意义(P小)则引入…。 局限性:即后续变量的引入可能会使进入方程的自变量变得不重要。 (2)?向后法(backward),先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。即只出不进。偏回归平方和最小的变量,作F检验及相应的P值,决定它是否剔除(P大) 。重复上述过程。 3.计算方法与步骤 首先确定引入与剔除变量的F统计量标准,检验水准a定为0.05~ 0.30,值越小表示选取自变量的标准越严。 注意:引入变量的检验水准要小于或等于剔除变量的检验水准。 四.注意事项 1.选择恰当的a和F值(选择不同的a 多做几次,看哪个更合要求)。 2.当自变量之间有高度相关时,很难建立模型。 3.可以考察变量之间的交互作用。 4.有从专业上认为必须引入 五. 回归系数反常分析 ㈠ 回归系数的反常现象 1. 回归系数的正负符号与客观实际不一致。 2. 专业认为有统计学意义,但结果无统计学意义。回归系数正常,但标准误很大,无统计学意义。 3. 稍微改变a,引入的变量差别较大,回归方程不稳定。 4. 重要变量进不了模型。 ㈡ 主要原因 1. 自变量的多重共线性 2. 设计时某些重要的变量没有考虑进来。 3. 样本量太小 4. 变量的测量误差大有异常值。 5. 变量取值范围太窄。 六.SAS程序 作业:课本P322例20-3 要求: 1.用R2和R2adj建模型 2.用Cp统计量建模型 3.用逐步回归建模型 4.对以上模型用press做出评价 * * 2. CP统计量 n为样本含量,p表示进入模型的自变量个数,m表示所有自变量个数, 表示从全部m个自变量的回归模型中得到的残差均方。 在模型变量个数减少的过程中第一次 值接近p+1时,模型最佳。如果 自变量中没有包含对 Y有主要作用的变量,则不宜用 方法选择自变量。 3.AIC准则 由Akaike在极大似然基础上提出的,Akaike信息量准则 AIC=n㏑(ssp)-2(p+1) ssp表示选入模型p个变量的剩余平方和。AIC越小越好。 X1 X2 X3 4.00 3 X2 X3 4.81 2 X1 X3 4.70 2 X1 X2 2.69 2 X3 8.99 1 X2 5.83 1 X1 3.71

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档