基于R语言多元数据统计图形可视化.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于R语言多元数据统计图形可视化

基于R语言多元数据统计图形可视化【摘 要】多元数据可视化越来越受到应用研究的重视,特别是多元数据的统计图形的实现得到了很多人的研究,本文综合介绍了常见的多元数据统计图形(箱须图、星相图、脸谱图、气泡图),并在R语言的环境下,给出了相应的程序函数语言。 【关键词】R语言;箱须图;星相图;脸谱图;气泡图 数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关,尤其统计图形更为重要,统计图形是对资料进行探索性研究的重要工具,当人们在运用其他统计方法对所得资料进行分析之前,往往习惯于把各资料在一张图上画出来,以直观地反映资料的分布情况及各变量之间的相关关系。当只有一个或两个变量时,可以使用通常的直角坐标系在平面上作图。当有三维数据时,虽然可以在三维坐标系里作图,但已很不方便。而当数据大于三时,用通常的方法已不能制图。许多多元统计分析问题,数据的维度都大于三,所以自20世纪70年代以来,多元数据的图示法一直是人们所关注的问题。 一、基于R语言的箱须图 箱须图(Box-whisker Plot)也称箱线图(Boxplot),于1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数、下四分位数及上四分位数。是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在R软件中,用boxplot()函数作箱线图,具体函数参数如下: Boxplot(x, ,range=1.5,width=NULL,varwidth=FALSE,notch= FALSE,outline=TRUE,Names,plot=TRUE,col=NULL,log=””,horizontal=FALSE,add=FALSE,at=NULL) 二、基于R语言的星相图 星相图是雷达图的多元表示形式,它将每个变量的各个观察单位的数值表示为一个图形,n个观察单位就有n个图,每个图的每个角表示每个变量,雷达图用于同时对多个指标的对比分析和对同一个指标在不同时期的变化进行分析。在R软件中,用Stars()函数作星相图,具体函数参数如下: Stars(x,full=TRUE,draw.segments=FALSE,…),x为数值矩阵或数据框;full为图形形状:full=TRUE为圆形,full=FALSE为半圆;draw.segments为分支形状:draw.segments=T为圆形,draw.segments=F为半圆。 三、基于R语言的脸谱图 脸谱图是用脸谱来表达多变量的样品,由美国统计学家H.Chernoff于1970年首先提出,该方法是将观测的个变量(指针)分别用脸的某一部位的形状或大小来表示,一个样品(观测)可以画成一张脸谱。他首先将该方法用于聚类分析,引起了各国统计学家的极大兴趣,并对他的画法作出了改进,一些统计软件也收入了脸谱图分析法,国内也有很多研究工作者将该方法应用于多元统计分析中。脸谱图分析法的基本思想是由15—18个指针决定脸部特征,若实际资料变量更多将被忽略 ,若实际资料变量较少则脸部有些特征将被自动固定。统计学曾给出了几种不同的脸谱图的画法,而对于同一种脸谱图的画法,将变量次序重新排列,得到的脸谱的形状也会有很大不同。按照切尔诺夫于1973年提出的画法,采用15个指标,各指标代表的面部特征为:1表示脸的范围,2表示脸的形状,3表示鼻子的长度,4表示嘴的位置,5表示笑容曲线,6表示嘴的宽度,7—11分别表示眼睛的位置,分开程度,角度,形状和宽度,12表示瞳孔的位置,13—15分别表示眼眉的位置,角度及宽度。这样,按照各变量的取值,根据一定的数学函数关系,就可以确定脸的轮廓、形状及五官的部位、形状,每一个样本点都用一张脸谱来表示。而脸谱容易给人们留下较为深刻的印象,通过对脸谱的分析,就可以直观地对原始资料进行归类或比较研究。在R软件中,用aplpack包中的faces()函数作脸谱图,具体函数参数如下: faces(xy,which.row,fill=FALSE,nrow,ncol,scale = TRUE,byrow =FALSE,main,labels) 四、基于R语言的气泡图 气泡图是一个将点表示为气泡(或圆圈)的散点图,与XY散点图类似,但可表现的数据信息量更多,最多可以表示五维(x位置、y位置、大小、颜色和时间),通过更改气泡的大小和颜色,按时间变化将气泡制成动画视觉效果,能使数据探索更加方便。在R软件中,用symbols()函数作气泡图,具体函数参数如下: Symbols(x,y=NULL,circles,squares,rectangl

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档