R软件一元线性回归分析.docxVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R 软件一元线性回归分析 数据选自数理统计教材例题 8.4.1 合金钢强度与碳含量的数据 碳含量 合金钢强度 序号 /% /107pa 1 0.10 42.0 2 0.11 43.0 3 0.12 45.0 4 0.13 45.0 5 0.14 45.0 6 0.15 47.5 7 0.16 49.0 8 0.17 53.0 9 0.18 50.0 10 0.20 55.0 11 0.21 55.0 12 0.23 60.0 这里取碳含量为x 是普通变量,取合金钢强度为y 是随机变量使用R 软件对以上数据绘出散点图 程序如下: x=matrix(c(0.1,42,0.11,43,0.12,45,0.13,45,0.14,45,0.15,47.5,0.16,49,0.17,53,0.18,50,0.2,55,0.21, 55,0.23,60),nrow=12,ncol=2,byrow=T,dimnames=list(1:12,c(C,E))) outputcost=as.data.frame(x) plot(outputcost$C,outputcost$E) 0 6 5 5 E tt$ os utc t t p 0 u 5 o 5 4 0.10 0.12 0.14 0.16 0.18 0.20 0.22 outputcost$C 很显然这些点基本上(但并不精确地)落在一条直线上。 下面在之前数据录入的基础上做回归分析(程序接前文,下同) lm.sol = lm(E~C,data = outputcost) summary(lm.sol) 得到以下结果: Call: lm(formula = E ~ C, data = outputcost) Residuals: Min 1Q Median 3Q Max -2.00449 -0.63600 -0.02401 0.71297 2.32451 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 28.083 1.567 17.92 6.27e-09 *** C 132.899 9.606 13.84 7.59e-08 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.309 on 10 degrees of freedom Multiple R-squared: 0.9503, Adjusted R-squared: 0.9454 F-statistic: 191.4 on 1 and 10 DF, p-value: 7.585e-08 由计算结果分析: 常数项?? =28.083,变量(即碳含量)的系数?? =132.899 0 1 y得到回归方程: ? =28.083+132.899x y 由于回归模型建立使用的是最小二乘法 ,而最小二乘法只是一种单纯的数学方法 ,存在着一定的缺陷 ,即不论变量间有无相关关系或有无显著线性相关关系 ,用最小二乘法都可以找到一条直线去拟合变量间关系。所以回归模型建立之后 ,还要对其进行显著性检验 : 在上面的结果中 sd( ?? )=1.567,sd( ?? )=9.606。而对应于两个 0 1 系数的P 值 6.27e-09 和 7.59e-08,故是非常显著的。 ?关于方程的检验,残差的标准差 ? ? =1.309。相关系数的平方 R 2 = 0.9503。关于 F 分布的P 值为 7.585e-08,也是非常显著的。我们将得到的直线方程画在散点图上,程序如下: abline(lm.sol) 得到散点图及相应的回归直线: 0 6 5 5 E tt$ os utc t t p 0 u 5 o 5 4 0.10 0.12 0.14 0.16 0.18 0.20 0.22 下面分析残差: outputcost$C 在R 软件中,可用函数residuals()计算回归方程的残差。程序如下: y.res=residuals(lm.sol); plot(y.res) 得到残差图 2 1 rs e r y. 0 1 - 2 - 2 4 6 8 10 12 Index 从残差图可以看出,第 8 个点有些反常,这样我们用程序将第 8 个点的残差标出,程序如下: text(8,y.res[8],labels=8,adj=1.2) 82 8 1 rs e r y. 0 1 - 2 - 2 4 6 8 10 12 Index 这个点可能有问题,下面做简单处理,去掉该样本点,编程如下: i=1:12; outputcost

文档评论(0)

hao187 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地上海
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档