R实现一元线性回归.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R实现一元线性回归

(一)、数据的读入与变量间关系 通过read.csv 函数将整理好的数据读入到工作空间中,并将数据框中的数据存储 为相应的变量名下数学成绩赋值于math、物理成绩赋值于physics.然后绘制出 两门成绩间的散点图以查看两者之间是否具有函数关系: data1 - read.csv(C:/Users/MyPC/Desktop/管理统计学/管理统计-一元线性 回归/six.csv,fileEncoding = GBK) math - data1[,2]; physics - data1[,3]; plot(math,physics,main=散点图,xlab=数学成绩,ylab=物理成绩) (二)、图形的解释与关系的确定 从散点图中可以看到,两门成绩间为线性关系,且为正相关即同增同减. 于是 利用函数cor()求出两门成绩的相关系数如下: cor(math,physics) ## [1] 0.7847639 (三)、一元线性模型的模拟及检验 由散点图以及相关系数可知,可使用一元线性回归模型对所给数据进行拟合,并对 未来的结果进行相应的预测.在拟合的模型基础上对拟合结果进行显著性检验,取 = 0.05. 函数代码及拟合结果如下: lm.fit - lm(physics~math,data=data1)#一元线性拟合 summary(lm.fit) ## ## Call: ## lm(formula = physics ~ math, data = data1) ## ## Residuals: ## Min 1Q Median 3Q Max ## -10.326 -7.793 1.067 5.852 12.223 ## ## Coefficients: ## Estimate Std. Error t value Pr(|t|) ## (Intercept) 5.4221 15.0617 0.360 0.724227 ## math 0.9427 0.1990 4.738 0.000318 *** ## ## Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 ## ## Residual standard error: 8.509 on 14 degrees of freedom ## Multiple R-squared: 0.6159, Adjusted R-squared: 0.5884 ## F-statistic: 22.44 on 1 and 14 DF, p-value: 0.0003178 从结果中可以得知: 回归方程为: = 0.9427+ 5.4221 又因− 0.05,所 以自变量数学成绩与因变量物理成绩有线性关系,且拟合情况良好. plot(residuals(lm.fit)) (四)、预测与分析 当给定数学成绩为80 分时,估计物理成绩的95%的置信区间. 代码及结果如下: pre.point - data.frame(math=80) predict(lm.fit,pre.point,interval=prediction,level=0.95) ## fit lwr upr ## 1 80.83471 61.89853 99.77088 置信区间为:[61.89853,99.77088]. (五)、回归直线与进一步的结果 回归直线的拟合如下: 代码及结果如下: plot(math,physics,main=一元线性回归,xlab=数学成绩,ylab=物理成绩) abline(lm.fit) 使用ggplot2 包进行进一步的分析置信区间曲线图(取= 0.05): library(ggplot2) ggplot(data1,aes(math,physics),xlab(math),ylab(physics))+geom_sm ooth(method=lm,color=red,linetype=2) 其中红色曲线是最佳拟合曲线,阴影带状就是每一个math (即数学成绩)对应的 physics (即物理成绩)的95%置信区间.

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档