《统计分析软件:使用R与Python》 课件 第3章-R 语言数据处理.pptx

《统计分析软件:使用R与Python》 课件 第3章-R 语言数据处理.pptx

  1. 1、本文档共89页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;R语言数据处理;3.1数据的输入与输出;cat()函数也用来输出,但它可以把多个参数连接起来再输出(具有paste()的功能)。例如:

cat(i=,i,\n)

注意使用cat()时要自己加上换行符“\n”。它把各项转换成字符串,中间隔以空格连接起来,然后显示。

如果要使用自定义的分隔符,可以用sep=参数,例如:cat(c(AB,C),c(E,F),\n,sep=)ABCEF

cat()还可以指定一个参数file=给一个文件名,可以把结果写到指定的文件中,如:

cat(i=,1,\n,file=c:/work/result.txt)

非常适用于中间或最后结果的存储。;cat()函数和print()都不具有很强的自定义格式功能,为此可以使用cat()与format()函数配合实现。

format()函数可以把数字和字符串转为统一格式的字符串,例如:

;例:print()函数和format()函数配合;formatC对输入向量的每一个元素单独进行格式转换而不生成统一格式,例如:

formatC(c(1,10000))

[1]11e+004;R的输出缺省显示在交互窗口。

可以用sink()函数指定一个文件以把后续的输出转向到这个文件,并可用append参数指定是否要在文件末尾附加:

sink(“E:/work/result.txt,append=TRUE)

ls()

d

sink()

调用无参数的sink()把输出恢复到交互窗口。;3.1.2读取数据;读取R内置数据

;读取纯文本文件

;读取纯文本文件

;read.table函数的格式:

read.table(file,header=FALSE,sep=,quote=\,

dec=.,row.names,col.names,

as.is=!stringsAsFactors,

na.strings=NA,colClasses=NA,nrows=-1,

skip=0,check.names=TRUE,fill=!blank.lines.skip,

strip.white=FALSE,blank.lines.skip=TRUE,

comment.char=#,

allowEscapes=FALSE,flush=FALSE,

stringsAsFactors=default.stringsAsFactors(),

fileEncoding=,encoding=unknown)

;读取纯文本文件;读其它格式的数据文件;已知数据分别存成SPSS数据文件(”educ_salarys.sav)、SAS数据文件(educ_salarys.xpt)、S-PLUS数据文件(educ_salarys)和Stata数据文件(educ_salarys.dta).

读SPSS文件的格式是:

rs-read.spss(educ_salarys.sav)

其变量rs是一个列表,如果打算形成数据框,则命令格式为

rs-read.spss(educ_salarys.sav,to.data.frame=TRUE);读其它格式的数据文件;读其它格式的数据文件;读取数据库数据

;读取数据库数据

;3.1.3保存数据;与save()函数类似的命令还有save.image()和saveRDS()等函数。

区别在于saveRDS()一般用于保存单个数据对象,save()函数可以保存一个或多个数据对象,save.image()可以保存整个工作空间的数据对象。

saveRDS()保存的单个文件(“rds”格式)需要readRDS()读取,save()和save.image()函数保存的.RData可以用load()读取。;保存为文本文件;保存为文本文件;3.2数据选择;3.2数据选择;3.2数据选择;3.2数据选择;思考题:

??1、head(mtcars)仅显示数据集mtcars前几个观测值?。

?????A、5

?????B、6

?????C、7

?????D、8;3.2数据选择;1.正整数索引?返回向量中特定位置的元素:;2.负整数索引?不会返回向量中特定位置的元素:;3.逻辑向量索引?选择对应值为TRUE的元素。这可能是最有用的取子集操作,因为我们在代码中常常得到逻辑向量。;4.空索引?返回原向量。这对向

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档