- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第四章概率、分布与随机模拟实验5简单描述统计分析及R语言实现(1)
5.1实验目的5.2实验原理5.3实验过程目录
1. 掌握使用R对数据作描述性统计分析的方法;2. 掌握R语言中生成随机数及进行随机抽样模拟的方法;3. 掌握蒙特卡洛模拟的方法。5.1实验目的
5.2实验原理?1.数据的集中趋势分析
众数是指在数据中发生频率最高的数据值。如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。对于对称分布的数据,均值和中位数较接近;对于偏态分布的数据,均值和中位数不同。
?2.数据的离散程度分析
?
在统计分析中,通常要假设样本的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本是否符合正态分布。偏度衡量的是样本分布的偏斜方向和程度;而峰度衡量的是样本分布曲线的尖峰程度。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布。3.数据的分布
5.3实验过程在R中用mean()函数计算样本均值,其调用格式为:mean(x,trim=0,na.rm=F)1.样本均值x:表示要计算均值的对象;trim:表示介于0到0.5之间的数(默认值是0),表示在计算均值之前,去掉两端数据的百分比;na.rm:为逻辑值,当取T时,允许样本中有缺失值。x-c(1:10,50)xm-mean(x)c(xm,mean(x,trim=0.1))
在R语言中,用var()计算样本方差,其调用格式为:var(x,y=NULL,na.rm=F)2.样本方差x:数值向量、矩阵或数据框;y:为NULL(默认值),此时计算样本方差;y为数值向量、矩阵或数据框时,计算样本协方差;na.rm:逻辑变量,当取值为T时,可处理缺失数据。另外,cov()和corr()分别可计算样本协方差矩阵和相关系数矩阵,其使用方法与var()一样。样本方差的开方称为样本均方差,在R中,sd()函数计算样本均方差,其调用格式为sd(x,na.rm=F)
将n个数据(观测值)按从小到大的顺序排列后,称其为顺序统计量。在R中用sort(x)计算样本x的顺序统计量;order()给出排序后的下标;rank()给出了样本x的秩次统计量。它们的调用格式及参数说明如下。sort(x,decreasing=F,na.last=NA,method=c(auto,shell,quick,radix),…)3.顺序统计量x:数值向量、矩阵或数据框;y:为NULL(默认值),此时计算样本方差;y为数值向量、矩阵或数据框时,计算样本协方差;na.rm:逻辑变量,当取值为T时,可处理缺失数据。
x:数值向量;decreasing:逻辑变量,取值为T,返回值为降序排列;取值为F(默认)时,返回值为升序排列;na.last:控制缺失数据的参数,当取值为NA(默认)时,不处理缺失值;当取值为T时,缺失数据排在最后;当取值为F时,缺失数据排在最前面;method:指定排序所用的算法,当取值为auto时,表示使用的是radix即基数排序算法;当取值为shell时,表示使用的是希尔排序算法;当取值为quick时表示使用的是快速排序算法;…:附加参数。
rank(x,na.last=TRUE,ties.method=c(average,first,last,random,max,min))其中参数x,na.last的含义与sort()一样,ties.method是x中存在重复分量时,秩的确定方法;当取值为average时取下标的平均值;当取值为first时,取该值出现的所有下标按升序排列;当取值为last时,取该值出现的所有下标按降序排列;当取值为random时,随机取一个下标;当取值为max时,取该值对应的下标中的最大者;当取值为min时,取该值对应的下标中的最小者。order(x,na.last=TRUE,decreasing=FALSE,method=c(auto,shell,radix))其中各参数的使用方法与sort()一样。
x-c(75,64,47.4,66.9,62.2,62.2,58.7,63.5)sort(x)#注意order()与rank()order(x)rank(x)#比较rank()的不同ties.method的区别x-c(1,1,2,2,2,3,3,3,3)rank(x,ties.method=average)rank(x,ties.method=max)rank(x,ties.method=last)
函数
您可能关注的文档
- 《统计学原理》(第二版)课件统计学原理CH1.ppt
- 《统计学原理》(第二版)课件CH3 统计调查与整理.ppt
- 《统计学原理》(第二版)课件CH4 样本信息的提取CH4(1).ppt
- 《统计学原理》(第二版)课件CH4 样本信息的提取CH4(2).ppt
- 《统计学原理》(第二版)课件CH5 参数估计5.1.ppt
- 《统计学原理》(第二版)课件CH5 参数估计5.2.ppt
- 《统计学原理》(第二版)课件CH5 参数估计5.3-5.4.ppt
- 《统计学原理》(第二版)课件CH6 假设检验6.1-6.2.ppt
- 《统计学原理》(第二版)课件CH6 假设检验6.3-6.5.ppt
- 《统计学原理》(第二版)课件CH7 方差分析CH7.ppt
文档评论(0)