R语言基础培训常用统计分析.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
练习四 答案 df<-read.csv(file=stu.data.csv,header=T) # 问题 1 A <- table(cut(df$weight, breaks = 40 + 15 * (0:7))) round(prop.table(A) * 100,2) # 计算频数比例 hist(df$weight, breaks = 7, xlim = c(40,140), xlab = weight, main = Frequency chart of weight) # 问题 2 shapiro.test(df$height) # 问题 3 fit<-aov(weight ~ Sex,data=df) summary(fit) library(agricolae) duncan.test(fit, Sex, alpha=0.05)$groups # 问题 4 t.test(df$weight, mu = 60, alternative = wo.sided) wt.m<- subset(df$weight,df$Sex==‘ 男 ') wt.f<- subset(df$weight,df$Sex==‘ 女 ') var.test(wt.m,wt.f) # 等方差检验 t.test(wt.m,wt.f, paired=F) # 问题 5 summary(df$Sex) ct<-c(87, 33) pt <- c(1.2/2.2, 1.0/2.2) chisq.test(ct, p = pt) 线性回归 比如产量与施肥量有关,病虫害发生时期与气温有 关,小麦单位面积产量与单位面积穗数、千粒重有关, 等等。因此,还需要研究两个或多个变量之间的关系。 一个变量的变化受另一个或几个变量的影响,称为 因果关系。 利用回归分析 (regression analysis) 来研究呈因果关系 的变量之间的关系。表示原因的变量为自变量,表示结 果的变量为因变量。回归分析有一元和多元回归分析。 3.6.1 简单线性回归 35 计算校正 R 2 这里 n 是对象的数量(样点数量), m 是解释变量的 数量(或更准确说,是模型的自由度)。只有模型 自由度( m )不要比观测值的数量( n )大(保证 n- m-1>0 ) , 公式是有效的。 多项式回归 fit <- lm( weight ~ N + I(N^2), data = df ) # 二次项回归模型 summary( fit ) # 回归分析结果 plot( df$N, df$weight ) # 绘制散点图 lines( df$N, fitted(fit) ) # 添加回归线 添加光滑曲线 require(graphics) plot(cars, main = lowess(cars)) lines(cars) lines(lowess(cars), col = 2) 多元线性逐步回归 最优线性回归方程为: y= -649.779 + 14.592 × x1 + 6.841 × x2 + 9.329 × x3 回归方程表明:对于川农 16 号小麦而言,当 x2 和 x3 固定时,穗数 x1 每增加 1 万 / 亩,产量 y 将平均增加 14.592Kg/ 亩;当 x1 和 x3 固定时,每穗粒数 x2 每增加 1 粒 ,产量 y 将平均增加 6.841Kg/ 亩;当 x1 和 x2 固定时,千 粒重 x3 每增加 1g ,产量 y 将平均增加 9.329 Kg/ 亩。 自变量的作用主次 第一种方法:计算通径系数 (path coefficient, p) 。 df.2 <- as.data.frame( scale(df) ) # 对数据集做标准化处理 lmfit <- lm(y ~ x1 + x2 + x3, data = df.2) round( coef ( lmfit ), 3) # 获取标准化回归系数 ####### 运行结果 ########## > round(coef(lmfit),3) (Intercept) x1 x2 x3 0.000 0.777 0.410 0.609 第二种方法:根据 x1 、 x2 、 x3 回归系数的 t 值大小,也可判断自变 量 x 的主次顺序,凡是 t 值较大者就是较重要的因子。 结论: 自变量 x 的主次顺序为:穗数 x1 > 千粒重 x3 > 每穗粒数 x2 。 交互作用多元线性回归 练习四 以数据 stu.data.csv 为例

文档评论(0)

sandajie + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档