R实习指导模板.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R实习指导模板

R统计图形 一图胜千言,优秀的图形可以将枯燥的数字以友好的形式展示在大家前面,从而让数据自己说话。在可视化技术如火如荼的发展之背景下, 本章主要向大家介绍R底层作图函数以及高水平作图函数,以及现今一些经典的R作图包. 4.1 引入 图 4.1 mapped 2011 想必大家看到这幅图,也许都想知道要怎么样才能画出来呢?是的,R就能完成,并且还能完成得非常漂亮.冰冻三尺非一日之寒,要想完成这么复杂但是美观的图案,还是得学习很多的东西,下面我们也就从R最基础的作图函数开始,达到你所见则能所画.或者想方法,让一般能实现的东西变得更加漂亮. 4.2 R 统计描述作图 4.2.1 直方图、经验分布图与QQ图 直方图的作图函数为hist(x),x为向量.其他参数详见帮助函数?hist. 与直方图相配套的核密度估计函数density(x),其目的是用已知样本估计其密度.其他参数详见?density. 经验分布函数的作图命令为ecdf(x). 不论是直方图还是经验分布图,要从比较上鉴别样本是否近似于某种类型的分布较困难,而QQ图可以帮助我们鉴别样本的分布是否近似于正态分布.qqnorm()和qqline()提供了画正态QQ图和相应直线的方法,其他的参数详见帮助文件. 例4.2.1 下面是15个学生的体重(单位:Kg)如下 75.0 64.0 47.4 66.9 62.2 62.2 58.7 63.5 66.6 64.0 57.0 69.0 56.9 50.0 72.0 对此数据作出直方图、核密度估计图以及QQ图. 命令为: w-c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64.0,57.0,69.0,56.9,50.0,72.0) hist(w,freq=F) #绘出密度直方图 lines(density(w),col=blue) #绘出蓝色的学生体重密度线 lines(44:76,dnorm(44:76,mean(w),sd(w)),col=red) qqnorm(w);qqline(w) #绘出学生体重的QQ图 我们得到下面的图: 图4.2 学生体重的直方图、核密度估计图和QQ图 由图4.2可以看出15个学生的体重是近似服从正态分布的. 4.2.2 箱线图 箱线图的作图函数为boxplot(),参数详见?boxplot. 在箱线图中,上(Q3)下(Q1)四分位数分别确定出中间箱体的顶部和底部,箱体中间的粗线是中位数所在的位置.由箱体向上下伸出的垂直部分成为“触须”,表示数据的散步范围,最远点为1.5倍四分位数间距,超出此范围的点称为异常指点,通常用“o”表示. 在R软件中,InsectSprays是内部的数据框,它由两列数据构成,一列叫count,由数据构成,另一列叫spray,由因子构成,共有A-F六个水平,现在画出数据count在这六个水平下的箱线图,其命令为: boxplot(count~spray,data=InsectSprays,notch=T,col=2:7) 得到下面的图形: 图4.3 InsectSpray的箱线图 由上面可以看出在C、D两个水平上,存在极端异常值点(处于外限之外),都含有“o”标记.col=2:7代表箱线图的颜色向量从2(红色)开始到7(淡黄色),图中的C、E、F水平上四分位数离中位数的距离远比下四分位数距中位数的距离大,说明这些水平上,数据呈右偏分布,即数值较小的占多数;同理,B、D水平下,数据呈左偏分布,数值较大的占多数. 当然boxplot()函数也还有其他很多的统计应用,希望您可以自己去学习. 4.3 高水平作图函数 4.3.1 高水平的函数作图简介 高水平作图函数有:plot()、pairs()、coplot()、dotchart()、contour()、image()、persp()等等 plot()函数的使用方法: plot(x,y):x,y为向量,生成y关于x的散点图. plot(x):x是一时间序列,生成时序图;x是向量,生成x关于下标的散点图;x是复向量,生成复数的实部与虚部的散点图. plot(f,y):f是因子,y是数值向量,生成y关于f水平的箱线图. plot(df):df为数据框,生成df中所有变量的相对散点图. pairs(x):x为矩阵,生成矩阵各列的散布图;x为数据框时,同plot(x)的功能. coplot()函数的使用方法: coplot(a~b|c):在给定c值下,a关于b的散点图. coplot(a~b|c+d):即按c,d划分下,a关于b的散点图. dotchart(x):构造数据x的点图,点图中,y轴是数据x标记,x 轴是数据x的数

文档评论(0)

haocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档