- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基本的统计量精选
基本的统计量
简介
统计是与数据分析相关的数学领域。统计方法与方程可以应用于一组数据,用以分析与解读结果,解释数据中的
变异,预测未来的数据。以下是一些我们可以计算的统计信息:
● 平均的值(均值)
● 一组数据中最频繁出现的数值(众数)
● 平均意义上,单次量测结果与均值的偏离程度(标准误)
● 一组数据中数值出现的范围(极差)
● 按数值大小排列的一组数中,居于正中间的数值(中位数)
统计在工程领域中具有重要意义,它为分析所收集的数据提供工具与方法。比如,一位化学工程师想要分析一个
搅拌桶的温度量测结果。统计的方法就可以用来决定:温度量测值的可靠度与再现性,在一组温度值内数值有多
大变化,桶内温度将来会发生怎样的变化,以及这位工程师对量测结果有多大的信心。此文将会涵盖基本的统计
函数,包括:均值,中位数,众数,标准误,加权平均值,标准差,相关系数,Z值与P值。
什么是统计?
在统计学家的观念里,世界是由总体(populations)与样本(samples)组成的。一个“总体” 的例子就是全美国的七年
级学生,相对应的“样本”就是七年级学生里面的一群人。在这个例子中,一位联邦健康关怀的官员想要知道七年
级学生的平均体重,并且希望能与其它国家的数据相比较。遗憾的是,如果要测量全美国每一位七年级学生的体
重将会耗资巨大。相反的,使用统计的方法,就可以通过测量一个样本或多个样本的体重来估计全美七年级学生
的平均体重。
总体参数(parameters)对应于总休,统计量(statistic)对应于样本。
参数是总体的一个特征。如同在上述的例子中,多数情况下直接去测量总体参数是不可行的,这时就需要选取一
个样本,并找到样本的统计量。此统计量就可以用来估计总体参数。(有一个统计学分支被称为演绎统计学,它
使用样本来推导总体的信息。)在这个例子中,总体参数就是全美七年级学生的平均体重,而样本统计量就是一
组七年级学生的平均体重。
大量的统计演绎工具要求样本是单个随机样本,并且独立收集。总之,就是要统计量可以被视作随机变量,在此
不作深入分析。需要关注的是,统计量可能因为在采样过程中出现大的变异,偏差,及其它误差等而引入瑕疵。
所以在进行统计分析时,要始终保持怀疑精神。
统计量有很多不同的形式,下面是一些例子。
基本的统计量
当对一组数据进行统计分析时,均值、中位数、众数、标准差都是可以通过计算得到的有用的数值。均值、中位
数、众数都可以用来估计一组数据的中点是在哪里。标准差是实际的数值与均值的平均距离。
均值(Mean)与加权平均值(weighted average)
均值的计算是由观测值的总和除以观测的次数n。尽管数值可以大于,小于,或等于均值,但是均值依然被认为
是一个对预测后续数据有价值的估计值。计算均值的公式为:
(1)
在与单次量测相关的误差是相同的或未知的情况下,可以使用此公式来计算均值。否则,就要使用加权平均值,
加权平均值在计算时引入了标准差。计算公式如下:
(2)
其中: ,xi 是单个数值。
中位数(Median)
中位数是包含奇数个数值的一组数据的中间的数值,或者包含偶数个数值的一组数据的中间两个数值的平均值。
众数(Mode)
一组数据的众数是指最频繁出现的数值。
考量
既然我们已经讨论过多种方式,可以用来描述一组数据,你可能想知道什么时候该用哪一种方式?如果所有的数
据相对集中,平均值就会告诉你这些数据集中于哪一点。另一方向,如果大多数数据集中于某一个,或是一组数
值,偶然有一些数值会明显的偏离,那么用众数来描述这一组数据就更精确,因为均值会引入这些偶然的偏离的
数值。如果你对数据分布的范围感兴趣,那么中位数就是有用的,一半的数据会在中位数以上,另一半数据会在
中位数以下,你就知道整个系统的中心在哪里。
标准差与标准差权重
标准差告诉我们整组数据与其均值相隔多近。如果一组数据的标准差比较小,说明这组数据相对集中;如果标准
差比较大,说明这一组数据散布在一个相对较宽的数值范围内。计算标准差的公式如下:
(3)
样本的标准差(方差的平方根)可以用来估计总体的真实方差。公式(3)是对总体方差的无偏估计。公式(3.1)是计
算样本标准差的另一种常见方法,但是它是对总体方差的有偏估计。尽管它是有偏估计,在某些情况下,它还是
有优势的。
(3.1)
当计算标准差的值与加权平均值相关时
您可能关注的文档
- 基于大数据技术的信用风险预警系统_光环大数据培训精选.pdf
- 基于句子级情感的中文网络评论的情感极性分类精选.pdf
- 基于多粒度计算和多准则融合的情感分类精选.pdf
- 基于大数据技术的数据仓库应用建设_光环大数据培训精选.pdf
- 基于复杂网络的信号检测与传递_刘宗华精选.pdf
- 基于大数据的图书馆个性化智慧服务体系构建精选.pdf
- 基于局域网的C-S无纸化考试模式研究结题报告精选.pdf
- 基于层次分析法的我国大型企业原始创新能力评价研究精选.pdf
- 基于广义可能性测度的可达性问题的模型检测精选.pdf
- 基于平衡膳食的中国农产品供需研究精选.pdf
- 2024–2025学年七年级生物上册单元速记与巧练(人教版)3.2被子植物的一生基础测试(原卷版).pdf
- 2024–2025学年七年级生物上册单元速记与巧练(人教版)3.4绿色植物是生物圈中有机物的制造者提升测试(解析版).pdf
- 高中英语译林版选修一:Unit 3 培优提能限时练(三).pdf
- 高中英语译林版选修一:Unit 3 Period 5 Extended reading—Reading comprehension.docx
- 高中英语译林版选修一:Unit 3 默写练习二 Extended reading Other parts.pptx
- 高中英语译林版选修一:Unit 2 默写练习三 单元回扣复习.pptx
- 高中英语译林版选修一:Unit 2 Period 3 Grammar and usage—Verb-ing forms as subjects and objects.pdf
- 初中物理尖子生自主招生培优讲义版块3 物态变化 专题3-1 温度以及不准确温度计的读数 (学生版) .pdf
- 高中英语译林版选修一:Unit 4 单元知识滚动练.pdf
- 2024–2025学年七年级生物上册单元速记与巧练(人教版)1.2了解生物圈速记清单(解析版).pdf
文档评论(0)