lesson9 (新窗口) - 上海财经大学.PPTVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
lesson9 (新窗口) - 上海财经大学

第九讲 回归分析 统计模型简介 一元线性回归模型 多元线性回归模型 统计模型简介 一 一元线性回归模型 概述 用编程功能做线性回归 模型拟合 过程分析 回归诊断 回归诊断图 诊断分析 用菜单功能做一元线性回归 1.1 概述 线性回归模型是实际中应用最广泛的一类统计模型。 一是因为它的简单性,它描述的变量间回归关系是最简单的线性形式; 二是因为在许多实际情形下,变量之间的关系大都可以近似地用线性关系来近似。 一元线性回归模型: 因变量 与一个自变量 (也称为解释变量)之间满足下面的关系: , 其中 , 为表示与间线性关系的未知参数,称为回归系数。 为随机误差。服从正态分布 ,误差的标准差 也为未知参数 模型的解释 因变量 主要受自变量 的影响,而且这一影响是线性的: ;其他所有因素对因变量的影响均可归结在随机因素 之中。如果样本 , ,..., 是对总体 的n次独立观察值,则 且 , ,..., 相互独立,具有相同的正态分布 。这就是回归分析中最简单的一元线性回归模型。模型的拟合都采用经典的最小二乘法来实现。 1.2 用编程功能做线性回归 1.2.1 模型拟合 上表为内部数据集air,共4个变量,111个观测,是纽约市连续111天的空气中的臭氧浓度等变量的指标。 我们做温度变量temperature对大气层臭氧浓度ozone的影响,即做ozone为响应变量(response variable),以temperature为解释变量(explanatory variable)的一元线性回归,使用lm( )即可实现 attach(air) air.fit1_lm(ozone~temperature,data=air) 1.2.2 回归分析 names(air.fit1) #查看模型队形air.fit1中所有元素的名称 air.fit1$coef #查看回归方程的系数 summary(air.fit1) #回归分析做总结性输出 Call: lm(formula = ozone ~ temperature, data = air) Residuals: Min 1Q Median 3Q Max -1.49 -0.4258 0.02521 0.3636 2.044 #以上第一部分 Coefficients: Value Std.Error t value Pr(|t|) (Intercept) -2.2260   0.4614 -4.8243 0.0000 temperature 0.0704 0.0059 11.9511 0.0000 Residual standard error: 0.5885 on 109 degrees of freedom Multiple R-Squared: 0.5672 F-statistic: 142.8 on 1 and 109 degrees of freedom,the p-value is 0 Correlation of Coefficients: (Intercept) temperature -0.9926 #以上第二部分 第一部分是关于残差信息的简单描述,反映出模型拟合效果的大体情况。由于线性模型中的随机误差通常假定为正态分布,如果模型假设正确,则模型拟合残差也应服从正态分布。因此,人们经常用残差信息来检验模型及其随机误差的正态分布假设是否正确。如果残差分布被怀疑是有偏的,可通过更为正式的残差分析进行检验,以此来判断选用该线性模型拟合当前数据是否恰当。 第二部分是关于回归系数方面的信息,包括回归系数的估计值、标准误差、t-统计量值和相应的p-值。回归系数是否显著(即是否明显不等于零)可以通过t检验来给出判断。从该部分给出的p-值可看出回归系数都是非常显著的。 根据回归系数的估计值,我们可以写出如下的线性回归方程 :

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档