2015多元统计回归04章—回归….docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
赵国1、为何要如此提出原假设? 2、p值 3、正确解读回归方程 4、多重共线性—岭回归 5、回归诊断的必要性 *第一节 回归分析(一元线性回归) §4.1 问题的引入 例4.1、 看一个例子。 居民对农产品消费y与居民收入x之间有密切的关系,政府为了对农产品市场进行有效的预测的管理,需要了解y与x之间的关系。 由于种种因素的影响,既使居民收入x相同,居民对农产品消费y也不会完全相同,因而,它们之间是一种非确定性的关系。那么,它们之间有没有关系?有什么样的关系? 为此,搜集了16组数据,见下表。 居民消费y与收入数据 N y x 1 116.5 255.7 2 120.8 263.3 3 124.4 275.4 4 125.5 278.3 5 131.7 296.7 6 136.2 309.3 7 138.7 315.8 8 140.2 316.8 9 146.8 330.0 10 149.6 340.2 11 153.0 350.7 12 158.2 367.3 13 163.2 381.3 14 170.5 406.5 15 178.2 430.8 16 185.9 451.5 为了看清其规律,把和看成是平面直角坐标系中的点,画出它们的图形(称为“散点图”),见下图。 从散点图可以看出,这些点大致分布在一条直线附近,但又不全在一条直线上。可以认为和之间的关系由两部分组成,一部分是由于的变化引起的的线性变化,记为,另一部分是由随机因素引起的,记为(: 如果把代入上式,可写成 此式称为线性回归模型。又因为随机因素在0附近上下波动,它们的均值为0,所以我们说独立同分布,其分布是均值为0,方差为的正态分布,记为。 由于每对有大、有小,我们考虑它们的平均水平,所以有: (2—3) 称此式为线性回归方程。 我们研究的问题是: 1、如何估计(0和(1?由于(0和(1的估计值和(0和(1(真实值)一般不相等,为了区别起见,将和的估计值分别记为和。因此,线性回归方程的估计式为 或记为 (2—4) 线性回归方程的估计式有时也简称为线性回归方程。称为y的估计值(预测值)。 2、如何检验线性回归方程的可信度? 3、如何检验线性回归方程系数的可信度? 4、如果线性回归方程是可信的,如何利用线性回归方程进行预测? §4.2 回归参数的最小二乘估计(LM) 如何估计和?直观的想法就是:选取的和能使得每一个误差 最小。或者说使得 最小 但是,由于有正、有负,有可能相抵消,所以考虑选取的和应能使得 达到最小。将(2—4)式代入上式,得 所以,选取的和能使得 达到最小。根据微积分的原理,可求得 其中 , 性质1、 性质2、 ,其中, 例4.2 (续例4.1) 下表是将的数据在SPSS下计算出来的结果。其中第3列的两个数即为、的估计值。 Regression Summary for Dependent Variable: y (Spreadsheet1) R= R2= Adjusted R2= F(1,14)=4049.9 p.00000 Std.Error of estimate: 1.2662 Beta Std.Err. B Std.Err. t(14) p-level Intercept 28.0406 1.8837 14.8860 0.0000 x 0.9983 0.0157 0.3521 0.0055 63.6392 0.0000 Coefficients Model Unstandardized Coefficients B Std. Error Standardized Coefficients Beta t Sig. 1 (Constant) 28.041 1.884 14.886 .00 X .352 .006 .998 63.639 .00 a Dependent Variable: Y 故,,。 §4.3 回归方程的显著性检验 1、对回归方程作显著性检验的原(零)假设为 (备择假设) 2、用F检验,检验统计量为 其中: —偏差平方和。描述了的分散程度。 —残差平方和。除x对y的线性影响外,其他因素对y的影响。 (此公式的推导见数理统计教材)—回归平方和,是拟合值的分散程度。而描述了的分散程度,的分散程度它是由回归直线上的分散性引起的。 可以证明,平方和分解公式 也可以写为: 平方和分解公式说明,的分散性可分解成两部

文档评论(0)

x5511167 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档