网站大量收购闲置独家精品文档,联系QQ:2885784924

统计分析软件:使用R与Python课件-R语言回归分析.pptx

统计分析软件:使用R与Python课件-R语言回归分析.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

7.1一元回归模型7.2多元回归模型7.3回归模型的拟合优度7.4回归模型诊断7.5模型选择7.6模型的预测R语言回归分析

R语言回归分析一元回归模型lm函数,R语言公式回归模型诊断残差分析、异常点检测、共线性检测(条件数、VIF、FG检验)模型选择模型的预测多元回归模型系数置信区间、标准化回归模型的拟合优度

需要建立数学模型,使得能够根据自变量的数值预测因变量的大小,或者解释因变量的变化.血压与年龄刹车距离与车速薪金与资历、教育程度、工作岗位认识程度的限制客观事物的复杂人们关心的(因)变量受另外几个(自)变量的关联性(非因果性)影响,并且存在众多随机因素.无法分析对象内在的因果关系

回归分析(RegressionAnalysis)的具体步骤收集一组包含因变量和自变量的数据;选定因变量与自变量之间的模型,利用数据按照最小二乘准则计算模型中的系数;利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;检验得到的模型是否适合于这组数据;利用模型对因变量作出预测或解释.

?7.1?一元回归模型

??

??

R语言模型formula?

?

?

?

?I就表示其中所有的运算符都是普通意义上的算术运算符

思考题?

例:一元回归分析示例物理学家James.D.Forbes试图通过水的沸点来估计海拔高度,他知道通过气压计测得的大气压可用于得到海拔高度,气压越低,高度越高,他测量了17个地方水的沸点(℉)及大气压数据,并且对数据作了简单的处理,得到了较为明确的数学关系,所提数据如下:

X-matrix(c(194.5,20.79,1.3179,131.79,194.3,20.79,1.3179,131.79,197.9,22.40,1.3502,135.02,198.4,22.67,1.3555,135.55,199.4,23.15,1.3646,136.46,199.9,23.35,1.3683,136.83,200.9,23.89,1.3782,137.82,201.1,23.99,1.3800,138.00,201.4,24.02,1.3806,138.06,201.3,24.01,1.3805,138.05,203.6,25.14,1.4004,140.04,204.6,26.57,1.4244,142.44,209.5,28.49,1.4547,145.47,208.6,27.76,1.4434,144.34,210.7,29.04,1.4630,146.30,211.9,29.88,1.4754,147.54,212.2,30.06,1.4780,147.80),ncol=4,byrow=T,dimnames=list(1:17,c(F,h,log,log100)))forbes=as.data.frame(X)相关数据如下:

首先,画自变量和因变量之间的散点图,进行数据探索分析。从散点图上发现X和Y的排列基本是在一条直线附近,那么我们可以假设X和Y的关系是线性的。

R语言实现有三种方式可以实现最小二乘法的简单线性回归,假设数据框为forbeslm(forbes$log100~forbes$F)lm(log100~F,data=forbes)attach(forbes)?;lm(log100~F);#处理完后用detach解除绑定lm.sol-lm(log100~F,data=forbes)summary(lm.sol)

通过P值(就是Pr那一列)来查看对应的解释变量x的显著性,通过将p值与0.05进行比较,若该值小于0.05,就可以说该变量与被解释变量存在显著的相关性。

MultipleR-squared和AdjustedR-squared这两个值,又被称为”拟合优度“和”修正的拟合优度“,是指回归方程对样本的拟合程度,这里我们可以看到,修正的拟合优度为0.99946,表示拟合程度超过五成,这个值越高越好。

F-statistic,也称为F检验,常用于判断方程整体的显著性实验,其p值2.2e-16,显然小于0.05,方程在P=0.05的水平上是通过显著性检验的。

回归方程?可以将得到的直线方程添加到散点图上。

提取模型信息lm()?的返回值是一个模型拟合结果对象;技术上就是?lm?的一个结果列表类。关于拟合模型的信息可以用能调用对象类?lm?的泛型函数显示,提取,图示等等。这包括add1coefeffectskappap

文档评论(0)

ning2021 + 关注
实名认证
内容提供者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档