《R语言与应用统计分析实验指导》实验5（简单描述统计分析及R语言实现）.pptx

下载文档

1
0
约4.8千字
约 30页
2024-08-09 发布于浙江
举报
版权申诉
保障服务

《R语言与应用统计分析实验指导》实验5（简单描述统计分析及R语言实现）.pptx

1、本文档共30页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第四章概率、分布与随机模拟实验5简单描述统计分析及R语言实现(1)

5.1实验目的5.2实验原理5.3实验过程目录

1. 掌握使用R对数据作描述性统计分析的方法；2. 掌握R语言中生成随机数及进行随机抽样模拟的方法；3. 掌握蒙特卡洛模拟的方法。5.1实验目的

5.2实验原理?1.数据的集中趋势分析

众数是指在数据中发生频率最高的数据值。如果各个数据之间的差异程度较小，用平均值就有较好的代表性；而如果数据之间的差异程度较大，特别是有个别的极端值的情况，用中位数或众数有较好的代表性。对于对称分布的数据，均值和中位数较接近；对于偏态分布的数据，均值和中位数不同。

?2.数据的离散程度分析

在统计分析中，通常要假设样本的分布属于正态分布，因此需要用偏度和峰度两个指标来检查样本是否符合正态分布。偏度衡量的是样本分布的偏斜方向和程度；而峰度衡量的是样本分布曲线的尖峰程度。一般情况下，如果样本的偏度接近于0，而峰度接近于3，就可以判断总体的分布接近于正态分布。3.数据的分布

5.3实验过程在R中用mean()函数计算样本均值，其调用格式为：mean(x,trim=0,na.rm=F)1.样本均值x：表示要计算均值的对象；trim：表示介于0到0.5之间的数(默认值是0)，表示在计算均值之前，去掉两端数据的百分比；na.rm：为逻辑值，当取T时，允许样本中有缺失值。x-c(1:10,50)xm-mean(x)c(xm,mean(x,trim=0.1))

在R语言中，用var()计算样本方差，其调用格式为：var(x,y=NULL,na.rm=F)2.样本方差x：数值向量、矩阵或数据框；y：为NULL(默认值)，此时计算样本方差；y为数值向量、矩阵或数据框时，计算样本协方差；na.rm：逻辑变量，当取值为T时，可处理缺失数据。另外，cov()和corr()分别可计算样本协方差矩阵和相关系数矩阵，其使用方法与var()一样。样本方差的开方称为样本均方差，在R中，sd()函数计算样本均方差，其调用格式为sd(x,na.rm=F)

将n个数据(观测值)按从小到大的顺序排列后,称其为顺序统计量。在R中用sort(x)计算样本x的顺序统计量；order()给出排序后的下标；rank()给出了样本x的秩次统计量。它们的调用格式及参数说明如下。sort(x,decreasing=F,na.last=NA,method=c(auto,shell,quick,radix),…)3.顺序统计量x：数值向量、矩阵或数据框；y：为NULL(默认值)，此时计算样本方差；y为数值向量、矩阵或数据框时，计算样本协方差；na.rm：逻辑变量，当取值为T时，可处理缺失数据。

x：数值向量；decreasing：逻辑变量，取值为T，返回值为降序排列；取值为F（默认）时，返回值为升序排列；na.last：控制缺失数据的参数，当取值为NA（默认）时，不处理缺失值；当取值为T时，缺失数据排在最后；当取值为F时，缺失数据排在最前面；method：指定排序所用的算法，当取值为auto时，表示使用的是radix即基数排序算法；当取值为shell时，表示使用的是希尔排序算法；当取值为quick时表示使用的是快速排序算法；…：附加参数。

rank(x,na.last=TRUE,ties.method=c(average,first,last,random,max,min))其中参数x，na.last的含义与sort()一样，ties.method是x中存在重复分量时，秩的确定方法；当取值为average时取下标的平均值；当取值为first时，取该值出现的所有下标按升序排列；当取值为last时，取该值出现的所有下标按降序排列；当取值为random时，随机取一个下标；当取值为max时，取该值对应的下标中的最大者；当取值为min时，取该值对应的下标中的最小者。order(x,na.last=TRUE,decreasing=FALSE,method=c(auto,shell,radix))其中各参数的使用方法与sort()一样。

x-c(75,64,47.4,66.9,62.2,62.2,58.7,63.5)sort(x)#注意order()与rank()order(x)rank(x)#比较rank()的不同ties.method的区别x-c(1,1,2,2,2,3,3,3,3)rank(x,ties.method=average)rank(x,ties.method=max)rank(x,ties.method=last)

函数

《R语言与应用统计分析实验指导》实验5（简单描述统计分析及R语言实现）.pptx 原文免费试下载