多元线性回归.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

12.4.3多重共线性问题的处理多重共线性问题的处理措施:(1).将一种或多种有关的自变量从模型中剔除,使保留的自变量尽量不有关(2).假如要在模型中保留所有的自变量,则应当:防止根据t记录量对单个参数进行检查;对因变量y值的推断(估计或预测)限定在自变量样本值的范围内。12.4.3多重共线性问题的处理【例12.5】运用例12.1所建立的回归方程,对多重共线性问题进行处理。解:首先,考虑将某些有关的自变量从模型中剔除。从前表可以看出,贷款余额与贷款项目个数的有关系数最高,并且从定性角度看,贷款余额与应收贷款之间也有很强的有关关系。因此将贷款项目个数和累积应收贷款这两个自变量剔除,建立不良贷款与贷款余额和固定资产投资额的线性模型。从成果可以看出,线性关系和各回归系数在0.05的明显水平下是明显的,多重共线性问题不存在了。12.4.3多重共线性问题的处理多重共线性问题带来的重要麻烦是对单个回归系数的解释和检查。在求因变量的置信区间和预测区间时一般不会受其影响,但必须保证用于估计或预测的自变量的值是在样本数据的范围之内。因此,假如仅仅是为了估计或预测,可以将所有自变量都保留在模型中。在建立多元线性回归模型时,不要试图引入更多的自变量,除非有必要。尤其是在社会科学的研究中,由于所使用的大多数数据都是非试验性质的,因此,在某些状况下,得到的成果往往并不令人满意,但这不一定是选择的模型不适合,而是数据的质量不好,或者是由于引入的自变量不合适。§12.7虚拟自变量的回归12.7.1在模型中引进虚拟变量12.7.2具有一种虚拟自变量的回归12.7.1在模型中引进虚拟变量1.虚拟变量(dummyvariable)是指用数字代码表达的定性自变量2.当模型中使用虚拟自变量时,称为虚拟自变量的回归。3.虚拟变量的取值只能是0,14.回归分析中引入虚拟自变量的措施:(1).假如定性自变量只有两个水平时。例如,性别(男,女)12.7.1在模型中引进虚拟变量(2).有两个以上水平的虚拟自变量。例如,贷款企业的类型(家电,医药,其他)一般而言,假如定性自变量有k个水平,需要引入k-1个虚拟变量。5.对于具有一种虚拟自变量的回归,采用下列形式的回归方程:12.7.1在模型中引进虚拟变量【例12.8】为研究考试成绩与性别之间的关系,从某大学商学院随机抽取男女学生各8名,得到他们的市场营销学课程的考试成绩如下表对性别引入虚拟变量12.7.2具有一种虚拟自变量的回归1.模型中只具有一种虚拟变量的回归:建立回归模型为:y=?0+?1x+e回归方程可写:E(y)=?0+?1x男(x=0):E(y)=?0—男学生考试成绩的期望值女(x=1):E(y)=?0+?1—女学生考试成绩的期望值注意:当指定虚拟变量0—1时?0总是代表与虚拟变量值0所对应的那个分类变量水平的平均值?1总是代表与虚拟变量值1所对应的那个分类变量水平的平均响应与虚拟变量值0所对应的那个分类变量水平的平均值的差值,即平均值的差值=(?0+?1)-?0=?112.7.2具有一种虚拟自变量的回归解:散点图男女【例12.9】沿用例12.8。试建立考试成绩与性别之间的线性回归模型,并解释回归系数的含义。12.7.2具有一种虚拟自变量的回归【例12.10】为研究工资水平与工作年限和性别之间的关系,在某行业中随机抽取10名职工,所得数据如下表12.7.2具有一种虚拟自变量的回归2.模型中具有一种数值型自变量和一种虚拟变量回归引进虚拟变量时,回归方程可写:E(y)=?0+?1x1+?2x2女(x2=0):E(y|女性)=?0+?1x1男(x2=1):E(y|男性)=(?0+?2)+?1x1?0的含义表达:女性职工的期望月工资收入(?0+?2)的含义表达:男性职工的期望月工资收入?1含义表达:工作年限每增长1年,男性或女性工资的平均增长值?2含义表达:男性职工的期望月工资收入与女性职工的期望月工资收入之间的差值(?0+?2)-?0=?2习题选讲【习题12.01】根据下面的数据用Excel进行回归,并对回归成果进行讨论,计算x1=200、x2=7时y的预测值。SUMMARYOUTPUT回归统计MultipleR0.459234RSquare0.210

文档评论(0)

130****8663 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档