- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验一元线性回归分析
一、问题
考察温度对产量的影响,测得下列10组数据:
温度X
(°C)
20
25
30
35
? ??
40
45
50
55
60
65
产量Y
(灯)
[
二、 要求
(1) 试画出这10对观测值的散点图。
(2) 求Y和X的相关系数,并判断X、Y是否存在线性相关性。
(3) 用最小二乘法求出Y对x的线性回归方程。
(4) 求出回归的标准误差:与回归拟合系数疋.
(5) 对回归方程做显著性检验。
(6) 画出回归残差图并做相应分析。
(7) 若温度为62乞,则产量为多少,并给出置信水平为95%的预测区间。
三、 目的和意义
学会使用R软件来做回归分析问题。
四、实验步骤
绘制x与y的散点图,初步确定回归方程,输入下列程序:
x-
matrix(c(20/z25//30//35//40//45//50//55//60//65//ncol=2/byrow=T/dimnames=list(l:10/c( forbes plot(forbes$x,forbes$y)
图表1
8L9LAgsD
8L
9L
AgsDq」OJ
20 30 40 50 60
forbes$x
从窗口中可以观察到,X与y大致成线性关系,假设其为y = po + P1X;
做回归分析,输入下列程序:
-lm(y/x,data=forbes)
summary
得到
Call:
lm(formula = y x, data = forbes)
Residuals:
Min IQ Median 3Q Max
Coefficients:
Estimate Std. Error t value Pr(|t|)
(Intercept) ***
Signif. codes: 0z***z z**z z*z 7 z, 1
Residual standard error: on 8 degrees of freedom
Multiple R-squared: , Adjusted R-squared:
F-statistic: on 1 and 8 DF, p-value:
有以上计算结果得:
Bo = 9.12121. pi = 0.22303, sd(po) = 0.4770 sd(pi) = 0.1063,
对应两个系数的P-值均小于xW8,是非常显著的,
关于方程的检验,残差的标准差o = 0.483,相关系数的平方R2 = 0.9821,关于F分 布的P-值为xio-8,也是非常显著的。
该模型能够通过t检验和f检验,因此回归方程为
y = 9.12121 4-0.223.3x
我们将得到直线方程放在散点图上,得到图表2:
图农2
forbesSx
下面分析残差,输入
abline
-residuals;plot
得到残差图图表3
图农3
0 _9OOOO OOCM10
0 _
9
O
O
O
O O
O
CM
10
Index
山上图知大部分点的绝对值都在以内,笫
山上图知大部分点的绝对值都在以内,笫7个点有点反常,可能存在一点问
题,现在做一些简单的处理:
text(7,[7]Jabels=7/adj=
i-l:10;forbes7 Im7-lm(y^x/data=forbes7)
summary(lm7)
得到
Call:
lm(formula = y ~ x,data = forbes7)
Residuals:
Min IQ Median 3Q Max
Coefficients:
EstimateStd. Error t value Pr(|t|)
(Intercept) ***
Signif. codes: 0^*^ 7 / J1
Residual standard error: on 7 degrees of freedom
Multiple R-squared: z Adjusted R-squared:
F-statistic: on 1 and 7 DF, p-value:
可以对比发现,回归系数没有发生什么变化,R?系数有所提高,但是p值增大很 多,说明样本点7不能去掉。所以回归方程还是
y = 9.12121 4-0.223.3x
预测
若温度为62。匚给出置信水平为95%的预测区间,输入以下代码
new(x=62)
-predict,new/interval=l,prediction,,Jevel=
得到
fit Iwr upr
1
山讣算结果可以得到预测值与相应的预测区间
原创力文档


文档评论(0)