统计建模与r语家言mathth.pptVIP

下载本文档

0
0
约5.97千字
约 23页
2018-12-29 发布于福建
举报

统计建模与r语家言mathth.ppt

统计建模与r语家言mathth

R的语法与数据结构语法符号命令或运算提示符 + 续行符基本算术运算 + 加号 - 减号 * 乘号 / 除号 ^ 乘方赋值符 = 或 - 求助符？ help() 例子： 3+5 3-5 3/5 3^5 x=5 ?plot help(plot) 向量向量是R中最为基本的类型一个向量中元素的类型必须相同，包括数值型整型单精度实型双精度实型逻辑型复值型字符型建立向量的方法(函数) seq() 或 : 若向量(序列)具有较为简单的规律 rep() 若向量(序列)具有较为复杂的规律 c() 若向量(序列)没有什么规律例子： 1:10 seq(1,10,by=0.5) seq(1,10,length=21) rep(2:5,2) rep(2:5,rep(2,4)) x=c(42,7,64,9) length(x) 向量运算中的循环法则(recycling rule) 1:2+1:4 1:4+1:7 向量的下标(index)与向量子集(元素)的提取正的下标提取向量中对应的元素负的下标去掉向量中对应的元素逻辑运算提出向量中元素的值满足条件的元素注：R中向量的下标从1开始，这与通常的统计或数学软件一致而象C语言等计算机高级语言的向量下标则从0开始！例子： x = c(42,7,64,9) x[1] x[-2] x[c(1,4)] x10 #值大于10的元素逻辑值 [1] TRUE FALSE TRUE FALSE x[x10] #值大于10的元素 [1] 42 64 x[x40x10] #产生(0,1)上100个均匀分布随机数 y = runif(100, min = 0, max = 1) sum(y0.5) #值小于0.5的元素的个数 [1] 47 sum(y[y0.5]) # 值小于0.5的元素的值的和 [1] 10.84767 数据框架(data frame) 许多数据集是数据框架的形式出现一个数据框架就是将许多向量组合起来的一个对象，它是二维的，通常其列表示变量，其行表示观测。建立数据框架的方法(函数) 若你的数据本身保存在一个文件中，则可以使用 read.table() 仅接受带有分界符的ASCII数据如果数据是电子报表的形式，则采用下面的两种变型 read.csv() 先将数据另存为带逗号的数据(Comma Seperated values) read.delim() 先将数据另存为用tab作为分界符的数据注：若数据集很大(如1,000,000观测x200变量)，则可由 ODBC联接由数据库读入. 若你在R中建立了一些向量并试图想由它们生成框架，则可以使用data.frame()，但需要同时cbind(). 例子： x=c(42,7,64,9) y=1:4 z.df=data.frame(cbind(INDEX = y, VALUE = x)) z.df INDEX VALUE 1 1 42 2 2 7 3 3 64 4 4 9 注 ? .df 只是为了提醒自己z.df是一个数据框架 ? INDEX和VALUE是重新命名的向量名字数据框架子集的提出取格式 foo[row, column]其中 foo 数据框架的名称 row 需要提出取的行号 column 需要提出取的行号例子(续上一例) 列表(list) 复杂的数据分析时，仅有向量与数据框架还不够有时需要生成包含不同类型的对象 R的列表(list)就是包含任何类型的对象例子: foo = list(x = 1:6, y = matrix(1:4, nrow = 2)) foo $x [1] 1 2 3 4 5 6 $y [,1] [,2] [1,] 1 3 [2,] 2 4 列表子集的提出取提取一个子对象如foo的x,下面三种方式等价 foo$xfoo[1]foo[[1]] 例子 foo$y foo[2] foo[[2]] foo[[1]][2] foo$y[2] foo

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

统计建模与r语家言mathth.pptVIP