一元线性回归模型检验.docxVIP

下载本文档

98
0
约5.54千字
约 7页
2021-11-18 发布于天津
举报
版权申诉

一元线性回归模型检验.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE PAGE # § 2.3 —元线性回归模型的统计检验回归分析是要通过样本所估计的参数来代替总体的真实参数，或者说是用样本回归线代替总体回归线。尽管从统计性质上已知，如果有足够多的重复抽样，参数的估计值的期望（均值）就等于其总体的参数真值，但在一次抽样中，估计值不一定就等于该真值。那么，在一次抽样中，参数的估计值与真值的差异有多大，是否显著，这就需要进一步进行统计检验。主要包括拟合优度检验、变量的显著性检验及参数的区间估计。、拟合优度检验拟合优度检验，顾名思义，是检验模型对样本观测值的拟合程度。检验的方法，是构造一个可以表征拟合程度的指标，在这里称为统计量，统计量是样本的函数。从检验对象中计算出该统计量的数值，然后与某一标准进行比较，得出检验结论。有人也许会问，采用普通最小二乘估计方法，已经保证了模型最好地拟合了样本观测值，为什么还要检验拟合程度？问题在于，在一个特定的条件下做得最好的并不一定就是高质量的。普通最小二乘法所保证的最好拟合，是同一个问题内部的比较，拟合优度检验结果所表示优劣是不同问题之间的比较。例如图2.3.1和图232中的直线方程都是由散点表示的样本观测值的最小二乘估计结果，对于每个问题它们都满足残差的平方和最小，但是二者对样本观测值的拟合程度显然是不同的。 1、总离差平方和的分解已知由一组样本观测值（Xj，Y） , i=1,2…,n得到如下样本回归直线 Y? = IVI?Xi 而Y的第i个观测值与样本均值的离差 yi = （Y -Y）可分解为两部分之和： yi 二Yi -Y 二（Yi -Y?）（Y? -Y^ei ?i （ 2.3.1）图2.3.3示出了这种分解，其中， ? =（Y? -Y）是样本回归直线理论值（回归拟合值）与观测值Yi的平均值之差，可认为是由回归直线解释的部分； e = （Y - Y?）是实际观测值与回归拟合值之差，是回归直线不能解释的部分。显然，如果 Y落在样本回归线上，则 Y的第i个观测值与样本均值的离差，全部来自样本回归拟合值与样本均值的离差，即完全可由样本回归线解释。表明在该点处实现完全拟合。图 2.3.3 对于所有样本点，则需考虑这些点与样本均值离差的平方和。由于 r 八 yf ■ ei2 - 2 恥可以证明送？e= o,所以有 y y：二 ?： e2 （232）记送y； =X （Y -丫）=TSS,称为总离差平方和（Total Sum of Squares）,反映样本观测值总体离差的大小；_ v （丫＞ _丫）2 =ESS,称为回归平方和（Explained Sum of Squares），反映由模型中解释变量所解释的那部分离差的大小； e：八（丫 -丫?）2 = RSS，称为残差平方和（Residual Sum of Squares），反映样本观测值与估计值偏离的大小，也是模型中解释变量未解释的那部分离差的大小。（2.3.2）表明丫的观测值围绕其均值的总离差平方和可分解为两部分，一部分来自回归线，另一部分则来自随机势力。因此，可用来自回归线的回归平方和占 Y的总离差的平方和的比例来判断样本回归线与样本观测值的拟合优度。读者也许会问，既然 RSS反映样本观测值与估计值偏离的大小，可否直接用它作为拟合优度检验的统计量？这里提出了一个普遍的问题，即作为检验统计量的一般应该是相对量，而不能用绝对量。因为用绝对量作为检验统计量，无法设置标准。在这里， RSS，即残差平方和，与样本容量关系很大，当n比较小时，它的值也较小，但不能因此而判断模型的拟合优度就好。 2、可决系数R2统计量根据上述关系，可以用 TOC \o 1-5 \h \z 2 ESS RSS R 1 - （233） TSS TSS 检验模型的拟合优度，称 R2为可决系数（coefficient of determination ）。显然，在总离差平方和中，回归平方和所占的比重越大，残差平方和所占的比重越小，则回归直线与样本点拟合得越好。如果模型与样本观测值完全拟合，则有 R2 =1。当然，模型与样本观测值完全 2 拟合的情况是不可能发生的， R不可能等于1。但毫无疑问的是该统计量越接近于 1,模型的拟合优度越高。在实际计算可决系数时，在屛已经估计出后，一个较为简单的计算公式为: (234)R2 = ?1 (234) 这里用到了样本回归函数的离差形式来计算回归平方和: ESS八八（?必）2 二？2 x2。在例2.1.1的收入-消费支出例中, 2=?2 2 =?2 _Xi 1 a y： (0.777)2 7425000 4590020 = 0.9766 说明在线性回归模型中，家庭消费支出总变差（释