R语言方法总结..doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R语言方法总结.

计算描述性统计量summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻 辑型向量的频数统计。 apply()函数或sapply()函数 计算所选择的任意描述性统计量。mean、 sd、 var、 min、 max、 median、 length、 range 和quantile。函数fivenum()可返回图基五数总括(Tukey’s five-number summary,即最小值、 下四分位数、中位数、上四分位数和最大值)。 sapply() describe(): Hmisc包返回变量和观测的数量、缺失值和唯一值的数目、平均值、 分位数,以及五个最大的值和五个最小的值。pastecs包若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。 若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。 若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果。这里使用了p值来计算平均数的置信区间(默认置信度为0.95 例: library(pastecs) stat.desc(mtcars[vars]) 5、describe():psych包 计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误 分组计算描述性统计量 aggregate(): 例:aggregate(mtcars[vars], by = list(am = mtcars$am), mean) 2、by(): 例: dstats - function(x)(c(mean=mean(x), sd=sd(x))) by(mtcars[vars], mtcars$am, dstats) by(mtcars[,vars],mtcars$am,plyr::colwis(dstats)) 3、summaryBy():doBy包 describe.by():doBy包describe.by()函数不允许指定任意函数, 例:library(psych) describe.by(mtcars[vars], mtcars$am) 5、reshape包分组 频数表和列联表 table():生成简单的频数统计表 频数转化为比例值转化为百分比二维列联表 prop.table():函数分别生成边际频数和比例 行和与行比例列和与列比例函数为这些表格添加边际和gmodels包 多维列联表 xtabs():都可以基于三个或更多的类别型变量生成多维列联表。 卡方独立性检验chisq.test() 例:library(vcd) mytable - xtabs(~Treatment+Improved, data=Arthritis) chisq.test(mytable) mytable - xtabs(~Improved+Sex, data=Arthritis) chisq.test(mytable) 2、Fisher精确检验 例:mytable - xtabs(~Treatment+Improved, data=Arthritis) fisher.test(mytable) 3、Cochran-Mantel—Haenszel检验 例:mytable - xtabs(~Treatment+Improved+Sex, data=Arthritis) mantelhaen.test(mytable) 相关性度量 1、assocstats(): 例:library(vcd) mytable - xtabs(~Treatment+Improved, data=Arthritis) assocstats(mytable) 2、cor():函数可以计算这三种相关系数, cov():函数可用来计算协方差 pcor():偏相关 ggm包 例:library(ggm) pcor(c(1, 5, 2, 3, 6), cov(states)) 相关性的显著性检验 cor.test() 其中的x和y为要检验相关性的变量, alternative则用来指定进行双侧检验或单侧检验(取值为two.side、 less或greater) ,而method用以指定要计算的相关类型(pearson、 kendall或spearman)当研究的假设为总体的相关系数小于0时,请使用alternative= less。在研究的假设为总体的相关系数

文档评论(0)

kaiss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档