一元线性回归模型检验.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE # § 2.3 —元线性回归模型的统计检验 回归分析是要通过样本所估计的参数来代替总体的真实参数, 或者说是用样本回归线代 替总体回归线。尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均 值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那么,在一 次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。 主要包括拟合优度检验、变量的显著性检验及参数的区间估计。 、拟合优度检验 拟合优度检验,顾名思义,是检验模型对样本观测值的拟合程度。检验的方法,是构 造一个可以表征拟合程度的指标, 在这里称为统计量, 统计量是样本的函数。 从检验对象中 计算出该统计量的数值, 然后与某一标准进行比较,得出检验结论。有人也许会问,采用普 通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程 度?问题在于,在一个特定的条件下做得最好的并不一定就是高质量的。 普通最小二乘法所 保证的最好拟合,是同一个问题内部的比较, 拟合优度检验结果所表示优劣是不同问题之间 的比较。例如图2.3.1和图232中的直线方程都是由散点表示的样本观测值的最小二乘估计 结果,对于每个问题它们都满足残差的平方和最小, 但是二者对样本观测值的拟合程度显然 是不同的。 1、总离差平方和的分解 已知由一组样本观测值(Xj,Y) , i=1,2…,n得到如下样本回归直线 Y? = IVI?Xi 而Y的第i个观测值与样本均值的离差 yi = (Y -Y)可分解为两部分之和: yi 二Yi -Y 二(Yi -Y?)(Y? -Y^ei ?i ( 2.3.1) 图2.3.3示出了这种分解,其中, ? =(Y? -Y)是样本回归直线理论值(回归拟合值)与 观测值Yi的平均值之差,可认为是由回归直线解释的部分; e = (Y - Y?)是实际观测值与 回归拟合值之差,是回归直线不能解释的部分。显然,如果 Y落在样本回归线上,则 Y的 第i个观测值与样本均值的离差,全部来自样本回归拟合值与样本均值的离差,即完全可由 样本回归线解释。表明在该点处实现完全拟合。 图 2.3.3 对于所有样本点,则需考虑这些点与样本均值离差的平方和。由于 r 八 yf ■ ei2 - 2 恥 可以证明送?e= o,所以有 y y:二 ?: e2 (232) 记送y; =X (Y -丫)=TSS,称为总离差平方和(Total Sum of Squares),反映样本 观测值总体离差的大小 ;_ v (丫> _丫)2 =ESS,称为回归平方和(Explained Sum of Squares),反映由模型中解释变量所解释的那部分离差的大小; e:八(丫 -丫?)2 = RSS,称为残差平方和(Residual Sum of Squares),反映样本观测 值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。 (2.3.2)表明丫的观测值围绕其均值的 总离差平方和 可分解为两部分,一部分来自回归 线,另一部分则来自随机势力。因此,可用来自回归线的回归平方和占 Y的总离差的平方 和的比例来判断样本回归线与样本观测值的拟合优度。 读者也许会问,既然 RSS反映样本观测值与估计值偏离的大小,可否直接用它作为拟 合优度检验的统计量?这里提出了一个普遍的问题,即作为检验统计量的一般应该是相对 量,而不能用绝对量。因为用绝对量作为检验统计量,无法设置标准。在这里, RSS,即 残差平方和,与样本容量关系很大, 当n比较小时,它的值也较小,但不能因此而判断模型 的拟合优度就好。 2、可决系数R2统计量 根据上述关系,可以用 TOC \o 1-5 \h \z 2 ESS RSS R 1 - (233) TSS TSS 检验模型的拟合优度,称 R2为可决系数(coefficient of determination )。显然,在总离差平 方和中,回归平方和所占的比重越大, 残差平方和所占的比重越小, 则回归直线与样本点拟 合得越好。如果模型与样本观测值完全拟合,则有 R2 =1。当然,模型与样本观测值完全 2 拟合的情况是不可能发生的, R不可能等于1。但毫无疑问的是该统计量越接近于 1,模型 的拟合优度越高。 在实际计算可决系数时,在 屛已经估计出后,一个较为简单的计算公式为: (234)R2 = ?1 (234) 这里用到了样本回归函数的离差形式来计算回归平方和: ESS八八(?必)2 二?2 x2。 在例2.1.1的收入-消费支出例中, 2=?2 2 =?2 _Xi 1 a y: (0.777)2 7425000 4590020 = 0.9766 说明在线性回归模型中,家庭消费支出总变差( 释

文档评论(0)

尐丶丑 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档