基本的统计量精选.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基本的统计量精选

基本的统计量 简介 统计是与数据分析相关的数学领域。统计方法与方程可以应用于一组数据,用以分析与解读结果,解释数据中的 变异,预测未来的数据。以下是一些我们可以计算的统计信息: ● 平均的值(均值) ● 一组数据中最频繁出现的数值(众数) ● 平均意义上,单次量测结果与均值的偏离程度(标准误) ● 一组数据中数值出现的范围(极差) ● 按数值大小排列的一组数中,居于正中间的数值(中位数) 统计在工程领域中具有重要意义,它为分析所收集的数据提供工具与方法。比如,一位化学工程师想要分析一个 搅拌桶的温度量测结果。统计的方法就可以用来决定:温度量测值的可靠度与再现性,在一组温度值内数值有多 大变化,桶内温度将来会发生怎样的变化,以及这位工程师对量测结果有多大的信心。此文将会涵盖基本的统计 函数,包括:均值,中位数,众数,标准误,加权平均值,标准差,相关系数,Z值与P值。 什么是统计? 在统计学家的观念里,世界是由总体(populations)与样本(samples)组成的。一个“总体” 的例子就是全美国的七年 级学生,相对应的“样本”就是七年级学生里面的一群人。在这个例子中,一位联邦健康关怀的官员想要知道七年 级学生的平均体重,并且希望能与其它国家的数据相比较。遗憾的是,如果要测量全美国每一位七年级学生的体 重将会耗资巨大。相反的,使用统计的方法,就可以通过测量一个样本或多个样本的体重来估计全美七年级学生 的平均体重。 总体参数(parameters)对应于总休,统计量(statistic)对应于样本。 参数是总体的一个特征。如同在上述的例子中,多数情况下直接去测量总体参数是不可行的,这时就需要选取一 个样本,并找到样本的统计量。此统计量就可以用来估计总体参数。(有一个统计学分支被称为演绎统计学,它 使用样本来推导总体的信息。)在这个例子中,总体参数就是全美七年级学生的平均体重,而样本统计量就是一 组七年级学生的平均体重。 大量的统计演绎工具要求样本是单个随机样本,并且独立收集。总之,就是要统计量可以被视作随机变量,在此 不作深入分析。需要关注的是,统计量可能因为在采样过程中出现大的变异,偏差,及其它误差等而引入瑕疵。 所以在进行统计分析时,要始终保持怀疑精神。 统计量有很多不同的形式,下面是一些例子。 基本的统计量 当对一组数据进行统计分析时,均值、中位数、众数、标准差都是可以通过计算得到的有用的数值。均值、中位 数、众数都可以用来估计一组数据的中点是在哪里。标准差是实际的数值与均值的平均距离。 均值(Mean)与加权平均值(weighted average) 均值的计算是由观测值的总和除以观测的次数n。尽管数值可以大于,小于,或等于均值,但是均值依然被认为 是一个对预测后续数据有价值的估计值。计算均值的公式为: (1) 在与单次量测相关的误差是相同的或未知的情况下,可以使用此公式来计算均值。否则,就要使用加权平均值, 加权平均值在计算时引入了标准差。计算公式如下: (2) 其中: ,xi 是单个数值。 中位数(Median) 中位数是包含奇数个数值的一组数据的中间的数值,或者包含偶数个数值的一组数据的中间两个数值的平均值。 众数(Mode) 一组数据的众数是指最频繁出现的数值。 考量 既然我们已经讨论过多种方式,可以用来描述一组数据,你可能想知道什么时候该用哪一种方式?如果所有的数 据相对集中,平均值就会告诉你这些数据集中于哪一点。另一方向,如果大多数数据集中于某一个,或是一组数 值,偶然有一些数值会明显的偏离,那么用众数来描述这一组数据就更精确,因为均值会引入这些偶然的偏离的 数值。如果你对数据分布的范围感兴趣,那么中位数就是有用的,一半的数据会在中位数以上,另一半数据会在 中位数以下,你就知道整个系统的中心在哪里。 标准差与标准差权重 标准差告诉我们整组数据与其均值相隔多近。如果一组数据的标准差比较小,说明这组数据相对集中;如果标准 差比较大,说明这一组数据散布在一个相对较宽的数值范围内。计算标准差的公式如下: (3) 样本的标准差(方差的平方根)可以用来估计总体的真实方差。公式(3)是对总体方差的无偏估计。公式(3.1)是计 算样本标准差的另一种常见方法,但是它是对总体方差的有偏估计。尽管它是有偏估计,在某些情况下,它还是 有优势的。 (3.1) 当计算标准差的值与加权平均值相关时

您可能关注的文档

文档评论(0)

tazhiq2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档