R语言 数据帧.pdfVIP

  • 14
  • 0
  • 约6.58千字
  • 约 6页
  • 2017-11-05 发布于河北
  • 举报
R语言 数据帧.pdf

R语⾔ 数据帧 数据帧是表或⼆维阵列状结构,其中每⼀列包含⼀个变量的值,并且每⼀⾏包含来⾃ 每⼀列的⼀组值 以下是数据帧的特性 列名称应为⾮空 ⾏名称应该是唯⼀的 存储在数据帧中的数据可以是数字,因⼦或字符类型 每个列应包含相同数量的数据项 创建数据帧 # Create the data frame. emp.data - data.frame( emp_id = c (1:5), emp_name = c(Rick,Dan,Miche e,Ryan,Gary), sa ary = c(623.3,515.2,611.0,729.0,843.25), start_date = as.Date(c(2012-01-01, 2013-09-23, 2014-11-15 2015-03-27)), stringsAsFactors = FALSE ) # Print the data frame. print(emp.data) 当我们执⾏上⾯的代码,它产⽣以下结果 - emp_id emp_name sa ary start_date 1 1 Rick 623.30 2012-01-01 2 2 Dan 515.20 2013-09-23 3 3 Miche e 611.00 2014-11-15 4 4 Ryan 729.00 2014-05-11 5 5 Gary 843.25 2015-03-27 获取数据帧的结构 通过使⽤str()函数可以看到数据帧的结构 # Create the data frame. emp.data - data.frame( emp_id = c (1:5), emp_name = c(Rick,Dan,Miche e,Ryan,Gary), sa ary = c(623.3,515.2,611.0,729.0,843.25), start_date = as.Date(c(2012-01-01, 2013-09-23, 2014-11-15 2015-03-27)), stringsAsFactors = FALSE ) # Get the structure of the data frame. str(emp.data) 当我们执⾏上⾯的代码,它产⽣以下结果 - data.frame: 5 obs. of 4 variab es: $ emp_id : int 1 2 3 4 5 $ emp_name : chr Rick Dan Miche e Ryan ... $ sa ary : num 623 515 611 729 843 $ start_date: Date, format: 2012-01-01 2013-09-23 2014-11-15 数据框中的数据摘要 可以通过应⽤summary()函数获取数据的统计摘要和性质 # Create the data frame. emp.data - data.frame( emp_id = c (1:5), emp_name = c(Rick,Dan,Miche e,Ryan,Gary), sa ary = c(623.3,515.2,611.0,729.0,843.25), start_date = as.Date(c(2012-01-01, 2013-09-23, 2014-11-15 2015-03-27)), stringsAsFactors = FALSE ) # Print the summary . print(summary(emp.data)) 当我们执⾏上⾯的代码,它产⽣以下结果 - emp_id emp_name sa ary start_date Min. :1 Length:5

文档评论(0)

1亿VIP精品文档

相关文档