多元线性回归预测法.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
与一元线性回归模型一样,根据最小二乘准则,我们的目的是使回归值 与实际观测值 之间的离差平方和最小令 则正规方程组可写成矩阵形式 若矩阵 可逆,则正规方程组有唯一解例1:从中国统计年鉴中取得西部各地区2009年电力消费量、国内生产总值(GDP)、电力价格变动(以水电燃料价格指数代表)等数据作为样本,列于下表中 依上式,所估计的样本回归模型为 地区电力消费量Y/(亿kw.h)国内生产总值X1/亿元水电燃料价格指数X2 /%内蒙古320.431734.31104.7广西356.952455.36101.7重庆248.011971.30109.0四川660.514875.12103.4贵州366.631185.0499.3云南353.202232.32102.9陕西355.972035.96103.2甘肃339.661161.43102.6青海125.51341.11107.3宁夏178.76329.28105.2新疆214.601598.28109.6例2:建立中国消费模型。选择消费总额为被解释变量,国内生产总值和前一年的消费总额为解释变量,变量之间关系为简单线性关系,选取1982-1996年统计数据为样本观测值。样本观测值列于下表中。得年份消费总额Y国内生产总值X1前一年消费额X2年份消费总额Y国内生产总值X1前一年消费额X2198133094901297619891055616466936019823638548933091990113621832010556198340216076363819911314621280113621984469471644021199215952258641314619855773879246941993201823450115952198665421013357731994272164711120182198774511178465421995345295940527216198893601470474511996401726849834529最小二乘估计量的特性1、线性性 是被解释变量的观测值 的线性函数2 、无偏性3 、参数估计量 的方差-协方差矩阵 ,其中 为矩阵 主对角线上的第j+1个元素也就是说, 服从正态分布,即被解释变量的估计值与观测值之间的残差随机误差项方差的估计量为 多元线性回归模型的检验一、拟合优度检验 总体平方和、残差平方和、回归平方和定义TSS为总体平方和,反映样本观测值总体离差的大小;ESS为回归平方和,反映由模型中解释变量所解释的那部分离差的大小;RSS为残差平方和, 反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小TSS=ESS+RSS(一)多重可决系数ESS越大,RSS就越小,从而被解释变量观测值总变差中能由解释变量解释的那部分变差就越大,模型对观测数据的拟合程度就越高。我们定义多重可决系数为它是介于0与1之间的一个数,越接近于1,模型对数据的拟合程度就越好统计量的自由度指可自由变化的样本观测值个数,它等于所用样本观测值的个数减去对观测值约束个数。TSS的自由度是(n-1),RSS的自由度是(n-k-1)(二)修正的可决系数当模型参数估计量已经得到后,可以方便地计算 。在应用过程中发现,如果在模型中增加一个解释变量,模型的解释功能增强了,回归平方和既然增大了,就增大了。这给人一个错觉:要使得模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得待估参数的个数增加,从而会使自由度减少。为此,可以用自由度去修正多重可决系数中的残差平方和与回归平方和。从而引入修正的可决系数修正可决系数与未经修正的多重可决系数之间有如下关系这意味着随着解释变量的增加,将小于例1当中, =0.9469, =0.9336在实际的计量分析当中,往往希望所建立模型的 或 越大越好。但应明确,可决系数只是对模型拟合优度的度量,只是说明列入模型中的解释变量对被解释变量的联合影响程度越大,并非说明模型中各个解释变量对被解释变量的影响程度也大。在实际应用中,达到多大才算模型通过了检验,没有绝对的标准,要看具体情况而定。模型的拟合优度并不是判断模型质量的唯一标准,有时甚至为了追求模型的经济意义,可以牺牲一点拟合优度。二、回归方程的显著性检验(F检验) 由于多元线性回归模型包含着多个解释变量,它们同被解释变量之间是否存在显著的线性关系呢? 需要对模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著作出推断。对回归模型整体显著性的检验可以证明,在

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档