- 54
- 0
- 约1.43万字
- 约 14页
- 2016-07-27 发布于湖北
- 举报
R语言方法总结
计算描述性统计量:
1、summary():
例: summary(mtcars[vars])
summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。
2、apply()函数或sapply()函数
计算所选择的任意描述性统计量。mean、 sd、 var、 min、 max、 median、 length、 range和quantile。函数fivenum()可返回图基五数总括(Tukey’s five-number summary,即最小值、下四分位数、中位数、上四分位数和最大值)。
sapply()
例: mystats - function(x, na.omit = FALSE) {
if (na.omit)
x - x[!is.na(x)]
m - mean(x)
n - length(x)
s - sd(x)
skew - sum((x - m)^3/s^3)/n
kurt - sum((x - m)^4/s^4)/n - 3
return(c(n = n, mean = m, stdev = s, skew = skew, kurtosis = kurt))
}
sapply(mtcars[vars], mystats)
3、describe():
Hmisc包:返回变量和观测的数量、缺失值和唯一值???数目、平均值、分位数,以及五个最大的值和五个最小的值。
例: library(Hmisc)
describe(mtcars[vars])
4、stat.desc():pastecs包
若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最 大值、值域,还有总和。
若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。
若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果。这里使用了p值来计算平均数的置信区间(默认置信度为0.95:
例: library(pastecs)
stat.desc(mtcars[vars])
5、describe():psych包
计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误
例: library(psych)
describe(mtcars[vars])
分组计算描述性统计量
1、aggregate():
例:aggregate(mtcars[vars], by = list(am = mtcars$am), mean)
2、by():
例: dstats - function(x)(c(mean=mean(x), sd=sd(x)))
by(mtcars[vars], mtcars$am, dstats)
by(mtcars[,vars],mtcars$am,plyr::colwis(dstats))
3、summaryBy():doBy包
例 library(doBy)
summaryBy(mpg + hp + wt ~ am, data = mtcars, FUN = mystats)
4、describe.by():doBy包(describe.by()函数不允许指定任意函数,)
例:library(psych)
describe.by(mtcars[vars], mtcars$am)
5、reshape包分组:(重铸和融合)
例:library(reshape)
dstats - function(x) (c(n = length(x), mean = mean(x),
sd = sd(x)))
dfm - melt(mtcars, measure.vars = c(mpg, hp,
wt), id.vars = c(am, cyl))
cast(dfm, am + cyl + variable ~ ., dstats)
频数表和列联表
1、table():生成简单的频数统计表
mytable - with(Arthritis, table(Improved))
Mytable
2、prop.table():频数转化为比例值
prop.table(mytable)
3、prop.ta
您可能关注的文档
- PROFACE.docx
- PROFIBUS_讲义.ppt
- Project II 项目任务与要求2015.ppt
- PROTELDXP2004节能灯设计.ppt
- pro_e5.0手机壳建模分析及NC序列(昆明理工大学).doc
- prtnD1_8连续性间断点.ppt
- psa-培训.ppt
- PSA工艺管道吹扫、冲洗、试压方案.doc
- PSA工艺管道吹扫冲洗方案.doc
- PS690.ppt
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测生物试卷+答案.doc
- 安徽省华师联盟2025-2026学年高三上学期1月质量检测语文试卷+答案.doc
- 四川省绵阳南山中学实验学校2025-2026学年高三上学期1月月考数学含答案.doc
- 2026届辽宁省大连市高三上学期双基考试物理试卷+答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测化学含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测生物含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测英语含答案.doc
- 辽宁名校联盟2026年1月高三上期末联考质量检测政治含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试化学含答案.doc
- 黑龙江省龙江教育联盟2026年1月高三上学期期末考试生物含答案.doc
最近下载
- 2025年北京第一次高中学业水平合格考物理试卷(含答案).pdf VIP
- 市政道路工程施工组织设计模版.doc VIP
- 15道公务员面试(国考)省级及以下机构重庆市网络信息类岗位面试问题考察点及参考回答.pdf VIP
- 跪拜土地阅读理解答案.docx VIP
- TAP检测项目介绍课件.ppt VIP
- 2025年综合类-心理治疗(师)-专业知识历年真题摘选带答案(5卷单选100题合辑).docx VIP
- 全国到地市矢量地图(很难找的资料)课件.pptx VIP
- 2025干部任前廉政知识考试题库及答案.pdf VIP
- 六年级上册期末道法知识点早读晚练小纸条.pdf VIP
- 质量管理小组活动推进指南(TCAQ10208-2024).docx
原创力文档

文档评论(0)