- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
16. 数据整合Ⅰ—基本操作目录:一. 数据框创建新变量二、变量的重命名三. 变量的重新编码四. 数据排序五. 数据合并六. 选取数据的子集七. 简单的随机抽样正文:一、数据框创建新变量假设有MyData数据框,其中变量为x1,x2. 现创建名为sumx和meanx的新变量,分别存储变量x1与x2的加和与均值。#方法1MyData$sumx - MyData$x1 + MyData$x2MyData$meanx - (MyData$x1 + MyData$x2)/2#方法2attach(MyData)MyData$sumx - x1+x2MyData$meanx - (x1+x2)/2detach(MyData)#方法3(建议方法)MyData - transform(MyData, sumx = x1 + x2,meanx = (x1+x2)/2)二、变量的重命名 1. 用交互式编辑器若修改数据集x的变量名,键入函数fix(x),即可打开交互式编辑器界面。score-data.frame(student=c(A,B,C,D),gender=c(M,M,F,F),math=c(90,70,80,60),Eng=c(88,78,69,98),pl=c(66,59,NA,88))fix(score)score.list-as.list(score)#将score转化为列表fix(score.list)(1)若数据集为矩阵或数据框将打开“数据编辑器”,单击要修改的变量名,在弹出的“变量编辑器”修改即可:(2)若数据集为列表将交互式编辑器为一个记事本,只需修改“.Names”之后对应的变量名即可:2. 用函数rename()reshape包中的函数rename(),用来修改数据库和列表的变量名,但不能修改矩阵的变量名,基本格式为:rename(x, c(oldname=newname,...))其中,oldname为原变量名,newname为新变量名。library(reshape)rename(score,c(pl=chinese))student gender math Engchinese1 A M 90 88 662 B M 70 78 593 C F 80 69 NA4 D F 60 98 88rename(score.list,c(pl=chinese))$student[1] A B C DLevels: A B C D$gender[1] M M F FLevels: F M$math[1] 90 70 80 60$Eng[1] 88 78 69 98$chinese[1] 66 59 NA 88注意:原数据集中的变量名并未被修改。3. 用函数names()和rename()一样可用来修改数据框和列表的变量名,不能修改矩阵的变量名;区别在于:names()会在原数据集中修改变量名。其基本格式为:names(x)[i]-newnamenames(score)[5]=chinesescorestudent gender math Engchinese1 A M 90 88 662 B M 70 78 593 C F 80 69 NA4 D F 60 98 88 4. 用函数colnames()和rownames()用来修改矩阵的变量名(行名和列名),也能修改数据框的行名和列名。基本格式为:rownames(x)[i]-newnamecolnames(score)[5]=Chinesescorestudent gender math Eng Chinese1 A M 90 88 662 B M 70 78 593 C F 80 69 NA4 D F 60 98 88rownames(score)=letters[1:4]scorestudent gender math Eng ChineseaA M 90 88 66bB M 70 78 59cC F 80 69 NAdD F 60 98 88三、变量的重新编码例如,数据集Leader中连续型变量age重新编码为分
文档评论(0)