R语言基础培训第一讲 R语言入门.pptVIP

  • 5
  • 0
  • 约1.24万字
  • 约 65页
  • 2019-08-17 发布于浙江
  • 举报
查看多个变量 #查看变量之间的相关性 cor(iris[ ,1:4]) # 针对每个 Species 水平绘制 Sepal.Length 的盒形图 boxplot(Sepal.Length ~ Species, data = iris) # 绘制任意两个矩阵之间的散点图,及变量之间的相关性 pairs(iris) 读入stu.data.csv,数据集对象命名为stu.df; 创建新变量armlegL,armlegL=arml+legl,并将其第2、5、7、10个值删除;然后再删除变量armlegL; 判断Grade的数据类型,将其转换为因子; 对数据集按age(升序)、weight(降序)排序。 构建df1A,使其含有stu.df的前20行组成的数据框; stu.df 从20行后的数据赋给df1B;合并df1A、df1B为df1; 构建df2A,使其含有stu.df的前6个变量组成的数据框;将stu.df的第1个变量和从第6个变量以后的数据组成df2B;合并df2A、df2B为df2; 从stu.df中提取出age20、Grade3的所有数据; 计算weight的平均值,找出height最大值。 练习二 练习二 答案 stu.df-read.csv(file=stu.data.csv,header=T) stu.df$armlegL-stu.df$arml+stu.df$legl stu.df$armlegL[c(2,5,7,10)]-NA stu.df$armlegL-NULL is.numeric(stu.df$Grade);summary(stu.df$Grade) stu.df$Grade-as.factor(stu.df$Grade);summary(stu.df$Grade) library(plyr) arrange(stu.df, age, -weight) df1A-stu.df[1:20,];df1B-stu.df[-1:-20,] df1-rbind(df1A,df1B) df2A-stu.df[,1:6];df2B-stu.df[,-2:-6] df2-merge(df2A,df2B,by=ID) df3-subset(stu.df,age20Grade3) mean(stu.df$weight);max(stu.df$height) * * * 这两位来自新西兰奥克兰大学的统计学教授现在依然是 R 语言开发团队的核心成员。(顺便指出:S 语言的创建者钱伯斯也是该团队的核心成员。某些用于 S 语言的数据处理线程不做任何更改即可在 R 语言环境中运行,并非巧合。) * * 对程序包分类介绍 * Package?source for unix * * Transform一般第一个参数为 * sqrt(-1) * 创建重复的向量 rep(2:5, 2) # 等价于 rep(2:5, times = 2) [1] 2 3 4 5 2 3 4 5 rep(2:5, rep(2, 4)) [1] 2 2 3 3 4 4 5 5 rep(1:3, times = 4, each = 2) [1] 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 1 1 2 2 3 3 paste(c(X,Y), 1:10, sep = -) #不规则 [1] X-1 Y-2 X-3 Y-4 X-5 Y-6 X-7 Y-8 X-9 Y-10 rep(factor(LETTERS[1:3]), 5) [1] A B C A B C A B C A B C A B C Levels: A B C 向量中元素的访问 a - c(1, 2, 5, 3, 6, -2, 4) # 向量 a 中第三个数据 a[3] [1] 5 # 向量 a 中第一、三、五个数据 a[c(1, 3, 5)] [1] 1 5 6 # 向量 a 中第二到第六个数据 a[2:6] [1] 2 5 3 6 -2 # 向量 a 中数值大于 3 的所有数据 a[a3] [1] 5 6 4 # 去掉第一个值 a[-1] [1] 2 5 3 6 -2 4 # 去掉前三个值 a[-1:-3] [1] 3 6 -2 4 矩阵matrix 概念:一个二维数组 #创建一个 2×2 的矩阵 matrix(1:4, nrow = 2, ncol = 2) [,1] [,2] [1,] 1 3 [2,] 2 4

文档评论(0)

1亿VIP精品文档

相关文档