- 135
- 0
- 约2.2万字
- 约 19页
- 2016-07-27 发布于湖北
- 举报
R语言学习详解
给出数据集mtcars的基本信息。
?mtcars #显示数据集mtcars的详细信息
Mtcars #显示数据集mtcars的全部32个观测值
head(mtcars) #显示数据集mtcars中前6个观测值
tail(mtcars) #显示数据集mtcars中后6个观测值
names(mtcars) #显示数据集mtcars中的变量
data.entry(mtcars) #浏览和修改mtcars数据集
浏览和修改mtcars数据集
mtcars-edit(mtcars) #修改数据后,存入同名数据集
MTcars-edit(mtcars) #修改数据后,存入新数据集
xnew-edit(data.frame()) #编辑生成新的数据集xnew
比较下列命令区别:
x-c(10.4, 5.6, 3.1, 6.4, 21.7) #建立数据向量
1、data.entry(x) #打开数据编辑器修改数据
2、edit(x) #打开R编辑器修改数据
直接修改mtcars(两个命令相同)
fix(mtcars)
mtcars-edit(mtcars)
attach(mtcars) #激活mtcars,
mpg #激活后,可直接用数据集的变量名
属性变量
table(cyl) #cyl是属性变量,计算其频数表
barplot(table(cyl)) #频数直方图(对属性变量的)
数值变量
stem(mpg) #茎叶图
hist(mpg) #直方图
boxplot(mpg) #盒形图
mean(mpg) #均值
mean(mpg,trim=0.1) #截取上下各10%数据后遗留数的均值
tapply(mpg,cyl,mean) #按分组变量cyl计算mpg的分组均值,如果将mean替换成其他统计量,就可以计算其它各种分组统计量
IQR(mpg) #计算四分位差(函数大写)Q3-Q1
quantile(mpg) #计算四分位点,标明各分位点的位置
fivenum(mpg) #计算四分位点,不标明各分位点的位置
quantile(mpg,probs) #计算按向量prob给定的各百分位的样本值
probs=c(0.1,0.5,99.5/100) #给出各百分位
quantile(mpg,probs) #计算相应的样本值
summary(mpg) #描述性统计
sd(mpg) #标准差
var(mpg) #方差
skewness(mpg) #偏度
kurtosis(mpg) #峰度
散点图
plot(cyl,mpg) #气缸数与油耗的散点图
plot(hp,mpg) #马力与油耗的散点图
不同气缸数下的散点图
plot(hp,mpg,pch=cyl) #马力与油耗的散点图,pch表示用字符图案画点
legend(250,30,pch=c(4,6,8), legend=c(4 cylinders,6 cylinders,8 cylinders)) #做出各气缸符号的说明标记。这里250,30是说明框的左上角位置
线形回归
z-lm(cyl~mpg) #将回归所有结果放入z中
cor(cyl,mpg) #汽缸数与油耗的相关系数
cor(cyl,mpg)^2 # 一元回归R square即为相关系数的平方
残差分析
lm.res-lm(cyl~mpg) #将回归所有结果放入lm.res中
lm.resids-resid(lm.res) #提取lm.res中的残差向量
plot(lm.resids) #画残差图
hist(lm.resids) #残差的直方图
qqnorm(lm.resids) #残差的qq图
qqline(lm.resids) #残差的qq线
结束分析并退出R
detach(mtcars) #从内存中清除数据集mtcars
q() #退出R
改变内存变量
name-Carmen;n1-10;n2-100;m-0.5 #定义内存变量
ls() #显示所有定义的内存对象
ls(pat=m) #显示内存中含m的指定对象
ls(pat=^m) #显示内存中打头字为m的指定对象
ls
原创力文档

文档评论(0)