- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R说话实战第二章代码
#2.1.1
data() #查看数据集列表
data(CO2) #载入CO2数据集(来自datasets)
library(MASS) #载入package MASS
data(package=MASS) #查看MASS中数据集
data(SP500,package=MASS) #载入MASS中的SP500数据集,也可简化为data(SP500)
#2.1.2
getwd() #返回当前工作目录,C:/Users/DELL/Documents
setwd(d:/data) #也可以写成setwd(d:\\data)“/ ”或“\\”
getwd() #返回当前工作目录d:/data
read.table(file, header=FALSE, sep=” ”,quote=”\” ,dec=”.“,
, as.is=!stringsAsFactors, na.strings=”NA”,skip=0, strip.white=FALSE, blank.lines.skip=TRUE,comment.char=”#”)
dec #设置用来表示小数点的字符;
s #向量的行名,默认为1,2,3.。。
na.strings #赋给缺数据的值(NA)
skip #开始读取数据前跳过的数据文件行数(一般为标题行)
strip.white #(是否消除空白字符)
blank.lines.skip #(是否跳过空白行)
data=read.table(d:/data/salary.txt,header=T) #读取数据,没有事先设定工作目录时
data=read.table(salary.txt,header=T) #出现缺失值会报错,不是有效读取大数据的方法
data #显示数据
data=read.csv(salary.csv,header=T) #出现缺失值会自动填补NA
一种更灵活的指令---函数scan()
scan(file=” ”, what=double(), nmax=-1, n=-1, sep=” ”,skip=0,nlines=0, na.strings=”NA”....))
scan()函数中如果不加参数,可以手动输入数据;scan()函数不存在header参数
what--指定要读取的数据类型,支持logical, integer, numeric,complex,character,raw,list
data2=scan(salary.txt,skip=1,what=list(City=,Work=0,Price=0,Salary=0))
#说明要创建列表,指定了列表中的对象名称,指定city是字符型,其他是数值型变量。
#由于不存在header参数,skip=1说明读取时跳过表示名称的第一行
data2
mode(data) #显示对象类型;[1] list
names(data) #显示对象中的标签;[1] City Work Price Salary
dim(data) #显示对象的维数;[1] 15 4
#要显示列表中的变量需要使用符号$,attach()简化
data$Salary #注意区分大小写
attach(data)
Salary
detach(data)
Salary
#2.1.3 读取固定宽度格式的文件 read.fwf()
#read.fwf() 通过widths参数指定一个向量c()来设置各个字段的宽度,小数点占一个字符
data.fwf=read.fwf(d:/data/fwf.txt,widths=c(2,4,4,3),s=c(W,X,Y,Z))
data.fwf
#2.1.4
data.excel=read.delim(clipboard) #clipboard即剪切板
mode(data.excel);dim(data.excel)
#RODBC提供R和各类数据库的一个接口,其中获取Excel连接的函数是odbcConnectExcel()和odbcConnectExcel2007(),分别用来读取Excel2003版(扩展名为.xls)和2007版(.xlsx)。
install.packages(RODBC)
library(RODBC)
channel=odbcConnectExcel2007(d:/data/Salary.xlsx) #获取Excel连接
sqlTables(channel) #列出excel中的表格
#获取Sheet1中的数据,可以使用如下的任意一种方式
data.excel2=sqlFetch(channel,Sheet1) #直接获取
data.
文档评论(0)