R软件及编程应用第六讲解析.ppt

  1. 1、本文档共92页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * 正态性检验:使用经验分布函数 (2)单组数据的描述性统计 描述性统计涉及的统计量包括:单均值、标准差、五数(最小值、第三4分位数、中位数、第一4分位数、最大值)等。 1)总体描述 在R中,函数summary( )可以计算出单组数据的均值和五数。 沿用上一节的例子,考虑雌性负鼠的总长度。summary (fpossum$totlnth)可以得到如下结果: 如果只需要均值,可用mean函数实现 3、单组数据的描述性统计分析 2)总体描述五数及样本分位数概括 在R中,计算五数用函数fivenum()。 若要得到分位数用函数quantile(), 计算中位数使用函数median(), 最大值使用函数max(), 最小值使用函数min()。计算更多概率值的样本分位数, 可使用选项probs。 以雌性负鼠的总长度为例。 3)离差的概括 样本的平均水平可以用平均值函数mean( )和中位数函数median( )来计算。样本的变异程度可以用极值(max( )-min( ))、四分位极值函数(IQR( ))、标准差函数(sd( ))、方差函数var( )和绝对离差函数(mad())来表示。 方差函数var( ) 也可用于计算两个向量协方差或一个矩阵的协方差阵。 mad( )在R中的定义为:1.4826*median(abs(x-median(x))) 其中系数1.4826约等于1/qnorm(3/4), 目的是为了使mad(x)作为方差的估计具有一致性(在正态或大样本下)。 仍以雌性负鼠的总长度为例(见脚本“离差的概括”)。 4)样本的偏度系数和峰度系数 偏度系数的定义?? 峰度系数的定义?? R的扩展统计程序包fBasics提供了函数skewness()用来求样本的偏度,函数kurtosis()用来求样本的峰度。fBasics程序包的函数basicStats( )提供了几乎上面所有的统计特征量 (1)两组数据的图形概括 1)散点图 在两组数据的图形展示中, 散点图是简单而重要的工具, 因为它能清楚地描述两组数据的关系。 实例分析:在R的程序包DAAG中有数据集cars, 使用下边的命令得到数据集:library(DAAG); data(cars); cars。得到数据由speed和dist两列构成,分别代表速度和终止距离。 希望估计速度(speed)和终止距离(dist)之间的关系。先考察它们之间的散点图。 4、多组数据的描述性统计分析 两组数据的图形描述:散点图 说明1:图像表明speed和dist基本呈现线性相依关系。 说明2:在此用一条非线性特殊曲线拟合这种关系。R中有两个函数可以实现此功能:lowess()和loess(),前者只适用于二维情况,后者可适用多维情况。 还可以通过rug()函数在横轴和纵轴上标明数据的具体位置。 也可以在数轴两边加上单变量的箱线图。这样既可以了解两个变量的统计量也可以看出两个变量之间的关系。 2)等高线图和三维透视图 有时候数据太多太集中,散点图上的信息不容易看出来,可用等高线来考察数据的统计特征。 实例:用程序包hdr中的hdr数据,绘制的散点图如下。 由于数据太多而且过于集中,从上图中很难看出x和y之间的关联性。 下面借助于二维的密度估计来认识图形。首先使用MASS程序包中的二维核密度估计函数kde2d()来估计这个二维数据的密度函数,再利用函数contour()绘制密度的等高线图。也可以用persp函数绘制三维透视图。 3)数据变换 当直接用原数据得不到有意义的图形时,可以对数据进行变换得到有意义的图形。最常用的有对数变换、倒数变换、指数变换和更一般的Box-Cox变换: 用程序包MASS中的数据集Animal来举例说明。 数据变换实例分析 说明1:左边图使用原始数据,右边的图是对原数据取对数。 说明2:左边的散点图是没有价值的,右图可看出两组数据在取对数(body和brain)后呈现明显的线性相依性。 对两组数据取对数在作图中经常用到。 (2)多组数据的图形描述 对于多组数据,有3种 作 图 的 方 法(函 数): pairs()或plot(), matplot()和boxplot()。它们都可以看成一维或二维画图函数的延伸。 1)散点图:多组数据的散点图就是不同变量的散点图像矩阵一样放在一起, 使用的函数为pairs(), 也可直接使用散点图函数plot() 2)矩阵图:matplot( )在处理多组数据时很好用。它与散点图矩阵的区别是将各个散点图放在同一个作图区域中。 3)框须图:使用函数boxplot( )可在同一个作图区域画出各组数的框须图(盒形图)。 4、多组数据的描述性统计分析 多组数据

您可能关注的文档

文档评论(0)

1192212 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档