网站大量收购闲置独家精品文档,联系QQ:2885784924

统计分析软件:使用R与Python课件-R语言基本统计推断.pptx

统计分析软件:使用R与Python课件-R语言基本统计推断.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

6.1R语言汇总统计量函数6.2R语言参数估计方法6.3参数假设检验6.4非参数假设检验?R语言基本统计推断

R语言基本统计推断R语言汇总统计量函数mean,median,sd,var,quantile,cor,cov非参数假设检验K-S检验Wilcoxon秩和检验卡方检验Fisher检验R语言参数估计方法点估计(矩法、MLE)区间估计参数假设检验假设检验的一般步骤、t-检验、二项分布、泊松分布、样本比例检验、方差分析

6.1R语言汇总统计量函数1.均值均值(mean)是数据的平均数,描述数据取值的平均位置。R语言中用mean()函数计算样本的均值,基本语法是:mean(x,trim=0,na.rm=FALSE)其中x是对象(如向量、矩阵、数组或数据框),trim参数是计算均值前去掉与均值差较大数据的比例,缺省值为0,即包括全部数据。当na.rm=TRUE时,将剔除缺失数据后再求均值。

选用参数trim减少输入误差对计算的影响如果第一个学生的体重少输入一个点,变为750千克

??R语言中用median()函数计算样本的均值median(x,na.rm=FALSE)

median(w)##[1]63.5针对包含异常值的数据w1(即第一人体重错误输入为750千克),计算中位数得:学生体重数据中的中位数median(w1)##[1]63.5学生体重中位数仍为63.5千克,基本不受异常值的影响,具有一定稳健性。

3.百分位数??在R软件中,quantile()函数计算观测量的百分位数quantile(x,probs=seq(0,1,0.25),na.rm=FALSE,names=TRUE,type=7,...)

quantile(w)##0%25%50%75%100%##47.4057.8563.5066.7575.00quantile(w,probs=seq(0,1,0.2))##0%20%40%60%80%100%##47.4056.9862.2064.0067.3275.00改变probs参数的默认值,可以给出不同位置的分位数:

4.方差、标准差方差函数var()和标准差函数sd()的基本语法为var(x,y=NULL,na.rm=FALSE,use)sd(x,na.rm=FALSE)var(w)sd(w)##[1]56.47##[1]7.515

5.极差??在R软件中,计算极差可借助range()函数range(...,na.rm=FALSE)

ran=range(w)#计算极差ran[2]-ran[1]##[1]27.6对于上述体重数据,极差计算如下:

6.相关系数与协方差对于来自多元总体的数据,除了分析各个分量的取值特点外,更重要的是分析各个分量之间的相关关系,如相关系数和协方差。R语言中,cor()和cov()函数可以计算相关系数和协方差,cor(x,y=NULL,use=everything,method=c(pearson,kendall,spearman))cov(x,y=NULL,use=everything,method=c(pearson,kendall,spearman))

对于JS数据集,部分数值变量的协方差矩阵如下:JS=read.csv(JSdata.csv)cor(JS[,6:8])##heightweightsalary##height1.00000.89480-0.13647##weight0.89481.00000-0.09135##salary-0.1365-0.091351.00000cor()函数在默认情况下得到的结果是一个方阵(所有变量之间两两计算相关)。

cor()函数也可以计算非方形的相关矩阵。#身高、体重两列变量与工资变量之间的相关系数cor(JS[,6:7],JS[,8])##[,1]##height-0.13647##weight-0.09135注意:cor()只能计算出相关系数,无法给出显著性水平p值。如果想计算p值,建议使用psych包中的corr.test函数或Hmisc包里的rcorr()函数。

对于JS数据集,部分列的协方差矩阵如下:JS=read.csv(JSdata.csv)cov(JS[,6:8])##

文档评论(0)

ning2021 + 关注
实名认证
内容提供者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档