用r软件做线性回归分析问题.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验一元线性回归分析 一、问题 考察温度对产量的影响,测得下列10组数据: 温度X (°C) 20 25 30 35 ? ?? 40 45 50 55 60 65 产量Y (灯) [ 二、 要求 (1) 试画出这10对观测值的散点图。 (2) 求Y和X的相关系数,并判断X、Y是否存在线性相关性。 (3) 用最小二乘法求出Y对x的线性回归方程。 (4) 求出回归的标准误差:与回归拟合系数疋. (5) 对回归方程做显著性检验。 (6) 画出回归残差图并做相应分析。 (7) 若温度为62乞,则产量为多少,并给出置信水平为95%的预测区间。 三、 目的和意义 学会使用R软件来做回归分析问题。 四、实验步骤 绘制x与y的散点图,初步确定回归方程,输入下列程序: x- matrix(c(20/z25//30//35//40//45//50//55//60//65//ncol=2/byrow=T/dimnames=list(l:10/c( forbes plot(forbes$x,forbes$y) 图表1 8L9LAgsD 8L 9L AgsDq」OJ 20 30 40 50 60 forbes$x 从窗口中可以观察到,X与y大致成线性关系,假设其为y = po + P1X; 做回归分析,输入下列程序: -lm(y/x,data=forbes) summary 得到 Call: lm(formula = y x, data = forbes) Residuals: Min IQ Median 3Q Max Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) *** Signif. codes: 0z***z z**z z*z 7 z, 1 Residual standard error: on 8 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 8 DF, p-value: 有以上计算结果得: Bo = 9.12121. pi = 0.22303, sd(po) = 0.4770 sd(pi) = 0.1063, 对应两个系数的P-值均小于xW8,是非常显著的, 关于方程的检验,残差的标准差o = 0.483,相关系数的平方R2 = 0.9821,关于F分 布的P-值为xio-8,也是非常显著的。 该模型能够通过t检验和f检验,因此回归方程为 y = 9.12121 4-0.223.3x 我们将得到直线方程放在散点图上,得到图表2: 图农2 forbesSx 下面分析残差,输入 abline -residuals;plot 得到残差图图表3 图农3 0 _9OOOO OOCM10 0 _ 9 O O O O O O CM 10 Index 山上图知大部分点的绝对值都在以内,笫 山上图知大部分点的绝对值都在以内,笫7个点有点反常,可能存在一点问 题,现在做一些简单的处理: text(7,[7]Jabels=7/adj= i-l:10;forbes7 Im7-lm(y^x/data=forbes7) summary(lm7) 得到 Call: lm(formula = y ~ x,data = forbes7) Residuals: Min IQ Median 3Q Max Coefficients: EstimateStd. Error t value Pr(|t|) (Intercept) *** Signif. codes: 0^*^ 7 / J1 Residual standard error: on 7 degrees of freedom Multiple R-squared: z Adjusted R-squared: F-statistic: on 1 and 7 DF, p-value: 可以对比发现,回归系数没有发生什么变化,R?系数有所提高,但是p值增大很 多,说明样本点7不能去掉。所以回归方程还是 y = 9.12121 4-0.223.3x 预测 若温度为62。匚给出置信水平为95%的预测区间,输入以下代码 new(x=62) -predict,new/interval=l,prediction,,Jevel= 得到 fit Iwr upr 1 山讣算结果可以得到预测值与相应的预测区间

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档