R软件及编程应用第四讲讲解.ppt

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
函数参数说明如下: 参数 描述 默认值 X 在此对象上应用函数(通常是向量) INDEX 列表因子,设置X中的值是如何分组交给FUN去计算的,与X等长 FUN 应用到X中元素的函数 NULL …. 传递给FUN的可选参数 simplify 若为TRUE,且FUN返回标量,那么tapply就返回一个与标量模式一致的数组。若为FALSE,tapply函数就返回列表 TRUE 举例 4、数据汇总 (3)aggregate()函数:应用于数据框的数据汇总函数。 定义形式如下: aggregate(x,by,FUN,…) 此函数也用于时间序列,参数略有不同: aggregate(x,nfrequency=1,FUN=sum, ndeltat=1, ts.eps=getOption(“ts.eps”),…) 参数说明:x,要聚合的对象;by,分组元素列表,长度与x一样;FUN,标量函数,用于计算总统计量,对数据框没有默认值,对时间序列默认值为sum;nfrequency,单位时间内的观察次数;…其他传递给FUN的参数。 举例 4、数据汇总 (4)rowsum()函数:应用于数据框的数据汇总函数,根据分组变量计算对象中某个变量的总和。 定义形式如下: rowsum(x,group,reorder=TRUE,…) 参数说明:x,要聚合的对象,包括向量、矩阵和数据框;group,分组元素列表或向量,长度与x一样;reorder,若为TRUE,输出结果会依照sort(unique(group))的结果进行排序,若为FALSE,则根据给出的group排序。na.rm,逻辑值,判断是否放弃NA值。 举例 4、数据汇总 (5)计数:tabulate()和table() a、tabulate()计算向量、矩阵、因子(不能是数据框)中没干过值的个数,返回的结果就是包含这些计数的向量,定义形式:tabulate(bin, nbins = max(1, bin, na.rm = TRUE)),bin: a numeric vector (of positive integers), or a factor. b、table()处理数据中的一些分类值。定义形式如下:table(…,exclude=if(useNA==“no”)c(NA,NA),useNA=c(“no”, “ifany”, “alway”),dnn=list.names(…), deparse.level=1)。 函数参数说明如下: 参数 描述 默认值 … 因子集合(或可转换成因子对象的集合) exclude 要删除的因子水平 if(useNA==“no”)c(NA,NA) useNA 设置是否使用表中的NA值 c(“no”, “ifany”, “alway”) dnn 用于设置结果维度名称 list.names(…) deparse.level 见帮助文件 1 举例 5、数据修整 数据修整:为了便于计算、存储数据,有时候需要改变数据的组织形式或更换统计量对数据重新统计计算。例如很多列但很稀疏的数据框,尽管可以直接拿来分析,但在保存时就会比较麻烦。R中提供了多种数据修整的函数。 (1)向量、矩阵和数据框的转置函数t() (2)窄数据和宽数据格式转换函数:unstack()、stack() (3)数据框形状修改函数reshape() 5、数据修整 (2)窄数据和宽数据格式转换函数:unstack()、stack() stack(x),x是数据框,可以将宽格式的数据形式转换成长格式的数据形式。 unstack(x,变量1~变量2) ,与stack的作用恰恰相反,把长格式的数据形式转换成宽格式的数据形式。但要注意第二个参数的公式类型:变量2会被当成因子类型,它的每个水平都会形成一列,变量1是相应的输出变量值。 举例 5、数据修整 (2)reshape函数:此函数比较复杂,它有两个功能,一个功能是把长数据转换成宽数据,另一个是把宽数据转换成长数据。定义形式: 使用说明 (1)、diresction参数用来设置所需的数据框是“长的”还是“宽的”。 (2)若将数据转换为宽数据时,需要设置idvar和timevar参数,将数据转换成长数据时,要设置varying参数。 (3)reshape是可逆的,如果一个对象d通过调用reshape创建的,还可以再次调用reshape将其转换成原来的数据框。 (4)还有功能更强大的reshape库和plyr包。 函数参数说明如下: 参数 描述 默认值 data 需要修整的数据框 varying 通常是变量名称列表。宽格式数据中的变量列表,它们需要分配到长格式中行 NULL v.names 长格式中的变

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档