- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学基本概念与EXCEL函数--第1页
统计学基本概念与EXCEL函数
编辑自CSDN zxca368
对于一维数据的分析,最常见的就是计算平均值 (Mean)、方差(Variance)和标准差(Standard
Deviation)。在做【特征工程】的时候,会出现缺失值,那么经常会用到使用平均值 或者 中位数
等进行填充。
一,平均值(Mean)
1,平均值的概念很简单:所有数据之和除以数据点的个数,以此表示数据集的平均大小;
2,平均值的EXCEL函数: AVERAGE
二,方差(Variance),这一概念的目的是为了表示数据集中数据点的离散程度;
1,总体方差
( 为总体方差, 为变量, 为总体均值, 为总体例数。)
2,样本中各数据与样本平均数的差的平方和的平均数叫做样本方差S2
样本方差的EXCEL函数:VARPA函数
样本标准差 标准差 (Standard Deviation, )
3,样本方差的算术平方根叫做 。 缩写SD ,中
文环境中又常称均方差,是离均差平方的算术平均数的平方根。标准差是方差的算术平方根。标
准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
标准差的EXCEL函数:
STDEV:用途:估算样本的标准偏差。它不计算文本值和逻辑值(如TRUE和FALSE)。它反映
了数据相对于平均值(mean)的离散程度。
:基于样本估算标准偏差。标准偏差反映数值相对于平均值(mean)的离散程度。文本值和逻
辑值(如TRUE和FALSE)也将计算在内。
:用途:返回整个样本总体的标准偏差。它反映了样本总体相对于平均值(mean)的离散程度。
统计学基本概念与EXCEL函数--第1页
统计学基本概念与EXCEL函数--第2页
简单说函数stdev 的根号里面的分母是n-1,而stdevp 是n,如果是抽样当然用stdev.在十个数
据的标准偏差如果是总体时就用STDEVP,如果是样本是就用STDEV 。
至于STDEVA 与STDEV 差不多,只不过它可以把逻辑值当数值处理。
4 ,协方差Covariance:
每对数据点的偏差乘积的平均数,利用协方差可以决定两个数据集之间的关系。
协方差的EXCEL 函数:covar(第一个所含数据为整数的单元格区域,第二个所含数据为整数的
单元格区域)
三,标准误差(Standard error ,缩写SE ),也称均方根误差(Root mean squared error),
标准误差是指在抽样试验(或重复的等精度测量) 中,常用到样本平均数的标准差。标准差与标准误
差,计算公式类似,但是是两个不同的概念。对一个总体多次抽样,每次样本大小都为n,那么每
个样本都有自己的平均值,这些平均值的标准差叫做标准误差。
设n 个测量值的误差为 ,则这组测量值的标准误差 等于:
(E 为误差=测定值—真实值。)stand error=stand
deviation/sqrt(样本数),
标准误差EXCEL 函数: excel 函数里没有标准误差可直接应用的函数,不过你可以用标准差
除以该组数据的个数n 的平方根来求。即σ/根号n,σ= stdev(array). 故,若数据组为a1:a10, 在要
显示结果的某个单元格里输入公式:= stdev
文档评论(0)