- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。 一元线性回归模型的统计检验 §3.2 拟合优度指标:决定系数R2 §3.3 变量之间线性关系的显著性检验 §3.4 回归参数的显著性检验 §3.5 残差图分析 §3.2 拟合优度指标:决定系数R2 一、总离差平方和的分解 二、可决定系数R2 统计量 一、总离差平方和的分解 二、决定系数R2统计量 由离差平方和的表达式可以看出,RSS越小,ESS越接近TSS。 一般来说,0≤R2≤1。 决定系数R2与样本相关系数r2是两个完全不同的概念。 相关系数反映的是变量之间线性关系的强弱程度,可正可负; 而决定系数R2反映的是回归方程的拟合程度,是一个比例关系,只能是非负的。 * 尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。 那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。 主要包括拟合优度检验、变量之间线性关系的显著性检验以及参数的显著性检验。 拟合优度检验,顾名思义,是检验模型对样本观测值的拟合程度。 检验的方法: (1)构造一个可以表征拟合程度的指标,在 这里称为统计量,他是样本的函数; (2)从检验对象中计算出该统计量的数值;(3)与某一标准进行比较,得出检验结论。 什么是拟合优度检验? 问题1:采用普通最小二乘法,已经保证了模型最好的拟合了样本观测值,为什么还要检验拟合程度呢? 问题在于,在一个特定的条件下做的最好的不一定就是高质量的。 普通最小二乘法保证的最好拟合,是同一个问题内部的比较;拟合优度检验结果所表示的优劣是不同问题之间的比较。 例如,我们可以看下面两个图的比较: (a) (b) OLS法样本回归直线 图(a)与图(b)中直线方程都是由散点表示的样本观测值的最小二乘估计结果,对于每个问题他们都满足残差平方和最小,但是二者对样本观测值的拟合程度显然是不同的。 拟合优度被定义为被解释变量Y的变异有多大程度可以用解释变量X来解释。解释的程度越高,拟合优度越好。 为了更清楚地看到这一点,我们把被解释变量Y的变异进行分解。 如何描述拟合优度? 图3.5 总离差的分解示意图 对上式两边分别求平方和,得到总离差平方和的表达式: 总离差平方和 从而有: TSS=ESS+RSS 即: 总离差平方和=回归平方和+残差平方和 可以证明: 其中: 总离差平方和(Total Sum of Squares) 反映样本观测值总体离差的大小。 回归平方和(Explained Sum of Squares) 反映由模型中解释变量所解释的那部分离差的大小。 残差平方和(Residual Sum of Squares ) 反映由样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。 TSS = ESS + RSS Y的观测值围绕其均值的总离差(TSS)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。 在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此: 拟合优度:回归平方和ESS/Y的总离差平方和TSS 问题2:既然RSS反映样本观测值与估计值偏离的大小,可否直接用它作为拟合优度检验的统计量? 这里提出了一个普遍的问题,即作为检验统计量的一般应该是相对量。因为用绝对量作为检验的统计量,无法设置标准。 而且,在这里残差平方和与样本容量关系很大,当n比较小时,它的值也较小,但不能因此而判断模型的拟合优度就好。 称 R2 为决定系数/判定系数(coefficient of determination)。 记 上式反映了总离差平方和中有多大比例可由解释变量来解释,他测度了Y的总离差中由回归模型解释的那个部分所占的比例。 解释程度越高,ESS越大,R2越接近于1,拟合 程度越好。 (1)当 0R21 时,Y的总离差由两部分来解释:由解释变量解释的部分占ESS/TSS,而由随机误差解释的部分占RSS/TSS; (2)当 R2=1 时,所有的实际点都落到回归直线上,此时Y的总离差完全被回归模型所解释,此时样本点得到了完全拟合; (3)当 R2=0 时,表示解释变量X并没有解释Y的总离差,Y的总离差完全
文档评论(0)