- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R实现一元线性回归
(一)、数据的读入与变量间关系
通过read.csv 函数将整理好的数据读入到工作空间中,并将数据框中的数据存储
为相应的变量名下数学成绩赋值于math、物理成绩赋值于physics.然后绘制出
两门成绩间的散点图以查看两者之间是否具有函数关系:
data1 - read.csv(C:/Users/MyPC/Desktop/管理统计学/管理统计-一元线性
回归/six.csv,fileEncoding = GBK)
math - data1[,2];
physics - data1[,3];
plot(math,physics,main=散点图,xlab=数学成绩,ylab=物理成绩)
(二)、图形的解释与关系的确定
从散点图中可以看到,两门成绩间为线性关系,且为正相关即同增同减. 于是
利用函数cor()求出两门成绩的相关系数如下:
cor(math,physics)
## [1] 0.7847639
(三)、一元线性模型的模拟及检验
由散点图以及相关系数可知,可使用一元线性回归模型对所给数据进行拟合,并对
未来的结果进行相应的预测.在拟合的模型基础上对拟合结果进行显著性检验,取
= 0.05. 函数代码及拟合结果如下:
lm.fit - lm(physics~math,data=data1)#一元线性拟合
summary(lm.fit)
##
## Call:
## lm(formula = physics ~ math, data = data1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.326 -7.793 1.067 5.852 12.223
##
## Coefficients:
## Estimate Std. Error t value Pr(|t|)
## (Intercept) 5.4221 15.0617 0.360 0.724227
## math 0.9427 0.1990 4.738 0.000318 ***
##
## Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
##
## Residual standard error: 8.509 on 14 degrees of freedom
## Multiple R-squared: 0.6159, Adjusted R-squared: 0.5884
## F-statistic: 22.44 on 1 and 14 DF, p-value: 0.0003178
从结果中可以得知: 回归方程为: = 0.9427+ 5.4221 又因− 0.05,所
以自变量数学成绩与因变量物理成绩有线性关系,且拟合情况良好.
plot(residuals(lm.fit))
(四)、预测与分析
当给定数学成绩为80 分时,估计物理成绩的95%的置信区间. 代码及结果如下:
pre.point - data.frame(math=80)
predict(lm.fit,pre.point,interval=prediction,level=0.95)
## fit lwr upr
## 1 80.83471 61.89853 99.77088
置信区间为:[61.89853,99.77088].
(五)、回归直线与进一步的结果
回归直线的拟合如下:
代码及结果如下:
plot(math,physics,main=一元线性回归,xlab=数学成绩,ylab=物理成绩)
abline(lm.fit)
使用ggplot2 包进行进一步的分析置信区间曲线图(取= 0.05):
library(ggplot2)
ggplot(data1,aes(math,physics),xlab(math),ylab(physics))+geom_sm
ooth(method=lm,color=red,linetype=2)
其中红色曲线是最佳拟合曲线,阴影带状就是每一个math (即数学成绩)对应的
physics (即物理成绩)的95%置信区间.
文档评论(0)