- 5
- 0
- 约4.63千字
- 约 13页
- 2021-12-02 发布于天津
- 举报
R 语言基础知识
R 的历史
R 是一个有着统计分析功能及强大作图功能的软件系统,是
由奥克兰大学统计学系的 Ross Ihaka 和 Robert Gentleman 共
同创立。由于他们的名字的首字母都是 R,因此 R 便成了这
门语言的名称。 R 受到了贝尔实验室的 S 语言的影响,因此
R 又被称之为 S 语言的方言。
寻求帮助
在学习 R 的过程中寻求帮助的方法主要分三种谷歌一下、 去
论坛提问和发邮件。
谷歌一下
在我们使用 R 的时候可能会遇到的一些问题, 首先我们需要
将问题或者错误的提示信息粘贴到谷歌中去。目前的翻墙方
法有很多,如 xx-net 和使用翻墙浏览器等。我登陆谷歌的方
法是使用天行者浏览器来登录谷歌,目前是可以正常使用
的。
论坛和邮件
如果谷歌没法帮我们解决问题,那么我们就需要到论坛或邮
件列表去咨询。在咨询的时候需要注意以下几点:
提供一个可以再现错误的例子,为了达到的目的是什么,使
用的 R 的操作系统、 R 的版本以及 R package 的版本等。
数据类型和数据结构
基本数据类型
在 R 语言里操作和接触的所有东西都称作对象 (object)。对
象有很多种类 可以包含各种类型的数据。 R 语言里所有的
东西都被称为对象, R 语言中常见的数据类型有几下几种,
分别是字符型 (character)、数值型 (numeric) 、整型 (integer)、
复数型 (complex) 、因子型( factor)以及逻辑型 (logical) 。
R 语言里最常见的基本对象是向量 (vector) ,一个向量可以
包含同一类型的多个对象。
数值型 (numeric): 一般数字形式的数据都为数值型(实数或
者小数),从传统的数据分类方式来看,即指定量变量。
x # 构造元素为 1,2,3,4,5 的向量 x
x # 输出 x 的值
[1] 1 2 3 4 5
class(x) # 显示 x 的数据类型
[1] numeric
整型 (integer): 仅含有整数, 且设定数据类型为 integer,否则
一般为数值型。
x1 = eger(x) # 将 x 转化为整数型数据 x1
class(x1) # 显示向量 x1 的数据类
型
[1] integer
复数型 (complex number):
x2 Conj(x3)
[1] 1+0i 2-4i
其中 i 是个特殊符号,代表复数的虚部( imaginary part )。
逻辑型 (logical): 取 TRUE 和 FALSE 两个固定值,用于指示
判断结果。
x = c(1,2,3,4,5) # 构造元素依次为 1,2,3,
4,5 的向量 x
x
[1] 1 2 3 4 5
x ==2 # 判断向量 x 中等于 2 的
元素
[1] FALSE TRUE FALSE FALSE FALSE
!(x # 判断向量 x 中大于等于 2 的元素
[1] FALSE TRUE TRUE TRUE TRUE
which(x # 选择向量中小于 2 的元素
[1] 1
is.logical(x) # 判断向量 x 是否为逻辑型
数据
[1] FALSE
字符型 (character):指向量中每个元素都是一个字符或字符
串,即一般的数据分类方式中所说的定性变量。
y # 构造元素为字符串 I 、love 、R 的向量 R
y # 输出 y 的值
[1] Ilove R
class(y) # 显示向量 y 的数据类型
[1] character
length(y) # 显示向量 y 的维度,也
就是 y 的元素个数
[1] 3
nchar(y) # 显示向量 y 中每个元素
的字符的个数
[1] 1 4 1
y == R # 判断向量 y 中为R 的
元素
[1] FALSE FALSE TRUE
因子型 (factor): 因子型数据类型简单来说就是披着定量数据
外壳的定性数据,即以数字代码的形式表现的字符型数据,
本质上为定性数据。
因子 (factor) 是一种特殊的向量类型 ,通常用来记录分类数
据。因子有两种类型:有序的以及无序的。无序因子可以认
为是用来标记那些有标签有类别但是又没有顺序的数据,比
如说男性和女性。序因子可以用来标记那些有先后次序的数
据,这些数据可以不是数值型的,但却是有序的。例如大学
的助理教授、副教授以及正教授,这就是一种有序的分类。
所以可以把有序因子当作是一个整型向量,其中每个整数都
有一个标签。例如一个由 1、2、3 组成的向量, 1 代表较高
的值, 2 代表一个中等的值, 3 代表一个较低的值。这三个
变量将会有三个标签,分别是高、中、低,在 R
原创力文档

文档评论(0)