R语言总结程序.docx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Lec00## 八、关于Markdown语言的简洁说明1. 一个#表示一级标题,二个#表示二级标题,依次类推;2. 空一段表示断行,而不是简单的敲一个回车表示断行;3. *斜体* (一对星号)表示斜体,**加粗** (一对双星号)表示加粗;4. Markdown语言兼容Latex语言。可处理数学公式Lec01## 1 数据的基本形式所有R处理的内容都叫对象(object)。进行统计分析时,我们的对象自然就是数据(data)。在R中,数据的基本格式分为以下5种:标量(scalar),向量(vectors),矩阵(matrices),数据框(data frames),因子(factors),及列表(lists)。所谓**向量**,就是一维的数值型、字符型或逻辑型数据的一维数组a - c(1, 2, 3, 4, -2, -5, 6) # 数值型,其中c表示concatenate(连结,串联),c()称为combine function, -表示赋值a # 显示向量ab - c(one, two, three) # 字符型,需要使用“”c - c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE) # 逻辑型d - c(1:5) # :表示产生一个系列,元素默认按列填充矩阵是一个二维数组,但要求其中的每个元素具有相同的模式(同为数值型、字符型或逻辑型)注意:每个元素的数据格式必需相同.y - matrix(1:20, nrow=4, ncol=5) #定义4行5列y[1,] ; y[,2] ; y[1,2] ; y[1,c(2,3)] ; y[c(2,3),2] # 显示矩阵y内的不同元素#### 定义名为matrix1的2×2矩阵,定义行列名,按行填充cells - c(1,-2,3,-4) ; rnames - c(R1, R2) ; cnames - c(C1, C2)matrix1- matrix(cells, nrow=2, ncol=2, byrow=TRUE,dimnames=list(rnames, cnames))数组(Array):三维或高维数据。数组与矩阵类似,但维度高于2维。array()函数的格式为: _array(vector, dimensions, dimnames)_ ,其中 * vector表示向量, * dimensions表示每个维度下的向量“长度”(元素个数), * dimnames表示维度名。dim1 - c(A1, A2) ; dim2 - c(B1, B2, B3) ; dim3 - c(C1, C2, C3, C4)z - array(1:24, c(2, 3, 4), dimnames=list(dim1, dim2, dim3)) # c(2, 3, 4)中的数字,表示dim1, dim2, dim3的长度数据框(dataframe):包含不同类型数据的数据。数据框的数据形式,就是常见的excel,spss,stata中的数据表单形式,它可以用来同时储存多种不同模式的数据。数据框函数: *data.frame() function* ,其格式如下:*mydata - data.frame(col1, col2, col3,…)* 其中, col1, col2, col3, …是任意类型的列向量名(需提前定义)。patientID - c(1, 2, 3, 4) # 数值型向量 ; age - c(25, 34, 28, 52) # 数值型向量 ; diabetes - c(Type1, Type2, Type1, Type1) # 字符型 ; status - c(Poor, Improved, Excellent, Poor) # 字符型patientdata - data.frame(patientID, age, diabetes, status,row.names=patientID) # 以上述向量,建立数据框上述命令中,row.names=patientID为指定“实例标识符”(case identifier)。设定此选项后,使用row.names(patientdata)命令,就可以以patientID为标记输出各个体的编号(ID)。#### 观测与变量patientdata[1:2] # 显示数据框中的第1至2列(第1至2个变量)patientdata[2,4] # 显示第2行第4列的数据patientdata[c(diabetes, status)] # 显示数据框中的指定列(变量)patientdata$age # “$”符号表示使用数据框中的某一变量,结果以行方式呈现。一般地,“A$x”表示“数据据

文档评论(0)

502992 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档