R语言实战-topic6回归分析.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Topic6 回归什么是回归回归其实是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量、 效标变量或结果变量)的方法。通常,回归分析可以用来挑选与响应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。我们的重点是普通最小二乘(OLS)回归法,包括简单线性回归、多项式回归和多元线性回归。 OLS回归是现今最常见的统计分析方法,其他回归模型(Logistic回归和泊松回归)将在第13章介绍OLS 回归的适用情境OLS回归是通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得的参数示例一名工程师想找出跟桥梁退化有关的最重要的因素,比如使用年限、交通流量、桥梁设计、建造材料和建造方法、建造质量以及天气情况,并确定它们之间的数学关系。他从一个有代表性的桥梁样本中收集了这些变量的相关数据,然后使用OLS回归对数据进行建模。解决以下几个方面的问题:?在众多变量中判断哪些对预测桥梁退化是有用的,得到它们的相对重要性,从而关注重要的变量。? 根据回归所得的等式预测新的桥梁的退化情况(预测变量的值已知,但是桥梁退化程度未知),找出那些可能会有麻烦的桥梁。? 利用对异常桥梁的分析,获得一些意外的信息。比如他发现某些桥梁的退化速度比预测的更快或更慢,那么研究这些“离群点”可能会有重大的发现,能够帮助理解桥梁退化的机制。OLS回归模型的形式:n为观测的数目,k为预测变量的数目,第i次观测对应的因变量的预测值,第i次观测对应的第j个预测变量值, 截距项,预测变量j的回归系数目标是使残差平方和最小:用 lm()拟合回归模型myfit - lm(formula, data)表达式(formula)形式如下:当回归模型包含一个因变量和一个自变量时,我们称为简单线性回归。当只有一个预测变量,但同时包含变量的幂(比如,)时,我们称为多项式回归。当有不止一个预测变量时,则称为多元线性回归简单线性回归通过身高来预测体重(women数据集) fit - lm(weight ~ height, data=women) summary(fit)Call:lm(formula = weight ~ height, data = women)Residuals: Min 1Q Median 3Q Max -1.7333 -1.1333 -0.3833 0.7417 3.1167 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) -87.51667 5.93694 -14.74 1.71e-09 ***height 3.45000 0.09114 37.85 1.09e-14 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 1.525 on 13 degrees of freedomMultiple R-squared: 0.991, Adjusted R-squared: 0.9903 F-statistic: 1433 on 1 and 13 DF, p-value: 1.091e-14 women$weight [1] 115 117 120 123 126 129 132 135 139 142 146 150 154 159 164 fitted(fit) 1 2 3 4 5 6 7 8 112.5833 116.0333 119.4833 122.9333 126.3833 129.8333 133.2833 136.7333 9 10 11 12 13 14 15 140.1833 143.6333 147.0833 150.5333 153.9833 157.4333 160.8833 residuals(fit) 1 2 3 4 5 6 2 0 0 0-0-0 7 8

您可能关注的文档

文档评论(0)

js1180 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档