- 0
- 0
- 约5.97千字
- 约 23页
- 2018-12-29 发布于福建
- 举报
统计建模与r语家言mathth
R的语法与数据结构 语法 符号 命令或运算提示符 + 续行符 基本算术运算 + 加号 - 减号 * 乘号 / 除号 ^ 乘方 赋值符 = 或 - 求助符 ? help() 例子: 3+5 3-5 3/5 3^5 x=5 ?plot help(plot) 向量 向量是R中最为基本的类型 一个向量中元素的类型必须相同,包括 数值型 整型 单精度实型 双精度实型 逻辑型 复值型 字符型 建立向量的方法(函数) seq() 或 : 若向量(序列)具有较为简单的规律 rep() 若向量(序列)具有较为复杂的规律 c() 若向量(序列)没有什么规律 例子: 1:10 seq(1,10,by=0.5) seq(1,10,length=21) rep(2:5,2) rep(2:5,rep(2,4)) x=c(42,7,64,9) length(x) 向量运算中的循环法则(recycling rule) 1:2+1:4 1:4+1:7 向量的下标(index)与向量子集(元素)的提取 正的下标 提取向量中对应的元素 负的下标 去掉向量中对应的元素 逻辑运算 提出向量中元素的值满足条件的元素 注:R中向量的下标从1开始,这与通常的统计或数学软件一致而象C语言等计算机高级语言的向量下标则从0开始! 例子: x = c(42,7,64,9) x[1] x[-2] x[c(1,4)] x10 #值大于10的元素逻辑值 [1] TRUE FALSE TRUE FALSE x[x10] #值大于10的元素 [1] 42 64 x[x40x10] #产生(0,1)上100个均匀分布随机数 y = runif(100, min = 0, max = 1) sum(y0.5) #值小于0.5的元素的个数 [1] 47 sum(y[y0.5]) # 值小于0.5的元素的值的和 [1] 10.84767 数据框架(data frame) 许多数据集是数据框架的形式出现 一个数据框架就是将许多向量组合起来的一个对象,它是二维的,通常其列表示变量,其行表示观测。 建立数据框架的方法(函数) 若你的数据本身保存在一个文件中,则可以使用 read.table() 仅接受带有分界符的ASCII数据 如果数据是电子报表的形式,则采用下面的两种变型 read.csv() 先将数据另存为带逗号的数据(Comma Seperated values) read.delim() 先将数据另存为用tab作为分界符的数据 注:若数据集很大(如1,000,000观测x200变量),则可由 ODBC联接由数据库读入. 若你在R中建立了一些向量并试图想由它们生成框架,则可以使用data.frame(),但需要同时cbind(). 例子: x=c(42,7,64,9) y=1:4 z.df=data.frame(cbind(INDEX = y, VALUE = x)) z.df INDEX VALUE 1 1 42 2 2 7 3 3 64 4 4 9 注 ? .df 只是为了提醒自己z.df是一个数据框架 ? INDEX和VALUE是重新命名的向量名字 数据框架子集的提出取 格式 foo[row, column]其中 foo 数据框架的名称 row 需要提出取的行号 column 需要提出取的行号 例子(续上一例) 列表(list) 复杂的数据分析时,仅有向量与数据框架还不够 有时需要生成包含不同类型的对象 R的列表(list)就是包含任何类型的对象 例子: foo = list(x = 1:6, y = matrix(1:4, nrow = 2)) foo $x [1] 1 2 3 4 5 6 $y [,1] [,2] [1,] 1 3 [2,] 2 4 列表子集的提出取 提取一个子对象如foo的x,下面三种方式等价 foo$xfoo[1]foo[[1]] 例子 foo$y foo[2] foo[[2]] foo[[1]][2] foo$y[2] foo
原创力文档

文档评论(0)