- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
常用统计方法用R实现 描述性统计 位置的度量: 均值、顺序统计量、中位数、百分位数。 均值计算: 若x是向量、矩阵,则mean(x)返回其全部元素均值。 若要返回数组某一维的均值:apply(x,dim,mean); dim=1计算行均值,dim=2计算列均值。 若x是数据框,则mean(x)返回各列的均值 Mean的一般用法: mean(x,trim=0,na.rm=FALSE) trim指定去掉x两端数的比例;na.rm=TRUE允许有缺失值。 类似有sum(x)函数可求x的和。 中位数 中位数描述数据中心位置的数字特征.大体上比中位数大或小的数据个数为整个数据的一半.对于对称分布的数据,均值与中位数比较接近;对于偏态分布的数据,均值与中位数不同.中位数的又一显著特点是不受异常值的影响,具有稳健性,因此它是数据分析中相当重要的统计量. 在R软件中,函数median()给观测量的中位数.如 x-c(75,64,47.4,66.9,62.2,62.2,58.7,63.5) median(x) median(x,na.rm=TRUE) #若数据中有缺失值 百分位数 百分位数(percentile)是中位数的推广.将数据按从小到大的排列后,0p1,它的p分位点定义为: 在R软件中,quantile()函数计算观测量的百分位数.如 w-c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63.5, 66.6,64.0,57.0,69.0,56.9,50.0,72.0) quantile(w) 一般用法: quantile(x,probs=seq(0,1,0.25),na.rm=FALSE) 分散程度的度量 表示数据分散(或变异)程度的特征量有方差、标准差、极差、四分位极差、变异系数和标准误等. 在R软件中,用var()和sd()计算方差、标准差: var(x, na.rm=FALSE,) sd(x,na.rm=FALSE) 变异系数、平方和 对于变异系数、校正平方和、未校正平方和等指标,需要编写简单的程序. 变异系数CV计算: cv-100*sd(x)/mean(x);cv 校正平方和CSS: css-sum((x-mean(x))^2);css 未校正平方和USS: uss-sum(x^2);uss 极差与标准误 样本极差(记为R)的计算: R=max(x)-min(x) 样本上、下四分位数之差称为四分位差(或半极差),记为R1.它也是度量样本分散性的重要数字特征,特别对于具有异常值的数据,它作为分散性具有稳健性,因此在稳健性数据分析中具有重要作用. 半极差计算:R1= quantile(x,0.75)- quantile(x,0.25) 样本标准误(记为sm)定义为s/sqrt(n) 样本标准误计算:sm=sd(x)/sqrt(length(x)) 分布形状的度量 偏度系数Kurtosis是刻划数据的对称性指标.关于均值对称的数据其偏度系数为0.右侧更分散的数据偏度系数为正,左侧更分散的数据偏度系数为负. 当数据的总体分布为正态分布时,峰度系数Skewness近似为0;当峰度系数为正时,两侧极端数据较多;当峰度系数为负时,两侧极端数据较少. 偏度系数Skewness 样本峰度系数sk计算程序 n-length(x ) m-mean(x) s-sd(x) sk-n/((n-1)*(n-2))*sum((x-m)^3)/s^3 计算公式 峰度系数Kurtosis计算 样本峰度系数ku计算程序 n-length(x m-mean(x) s-sd(x) ku-((n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4 -(3*(n-1)^2)/((n-2)*(n-3))) 计算公式 相关分析 R软件采用用cov()函数计算协方差或协方差阵,用cor()函数计算相关矩阵(相关系数)。 函数cov()和cor()的使用格式为: cov(x,y=NULL,use=all.obs“,method=c(pearson,kendall,spearman)) cor(x,y=NULL,use=all.obs“,method=c(pearson,kendall,spearman)) 其中x是数值型向量、矩阵或数据框.y是空值(NULL,缺省值)、向量、矩阵或数据框,但需要与x的维数相一致. 与cov和cor有关的函数还有: cov.wt----计算加权协方差(加权协方差矩阵);cor.test---计算相关性检验. 相关分析示例 例
您可能关注的文档
最近下载
- 专题19 导数之凹凸反转问题(解析版).pdf VIP
- 混凝土筒仓仓壁及漏斗计算.xls VIP
- 2025版体育与健康课程标准新课标考试题库及答案.docx VIP
- 2023导数通关专题19 导数之凹凸反转问题(原卷版)).docx VIP
- 河北省衡水市2024-2025学年高二上学期期中考试生物试题含答案.docx VIP
- 算法设计与分析 课件 许瑾晨 第4--10章 分治法 --- 综合应用 .pptx
- 保时捷718Cayman汽车使用手册说明书pdf电子版下载.pdf
- 河北省邯郸市武安市2024-2025学年高二上学期10月期中考试生物试题含答案.docx VIP
- 2024《女性慢性盆腔痛诊治中国专家共识》解读PPT课件.pptx VIP
- 造价咨询服务投标方案-(投标文件).doc VIP
原创力文档


文档评论(0)