统计学相关术语.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学相关术语 1、概率(proability ):度量一随机事件发生可能性大小的实数,其值介于0 与1 之间。一 随机事件的慨率可看作在相同条件下重复试验时,该事件发生的频率的稳定值,也可看作对 事件发生的相信程度。 2、统计学(statistic ):主要通过利用概率论建立数学模型,收集所观察系统的数据,进行 量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。也就是收集、处 理、分析、解释数据并从数据中得出结论的科学。主要又分为描述统计学和推断统计学。 3、描述统计(Descriptive statistic ):描述统计是通过图表或数学方法,对数据资料进行 整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。 目的是描述数据特征,找出数据的基本规律。描述统计分为集中趋势分析和离中趋势分析和 相关分析三大部分。 4、推断统计(Inferential Statistic ):推断统计是研究如何根据样本数据来推断总体数量特 征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形 式表述的推断。主要包括参数估计与假设检验两种方法。 描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映 了应用统计方法探索客观事物数量规律性的不同过程。 5、数值型数据(metric data) :按数字尺度测量的观察值,结果表现为具体的数值,对事物 的精确测度,例如:身高为175cm、168cm、183cm。 6、分类数据(categorical data) :只能归于某一类别的非数字型数据,对事物进行分类的结 果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。 7、总体(population) :所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。分 为有限总体和无限总体:有限总体的范围能够明确确定,且元素的数目是有限的;无限总体 精品资料 所包括的元素是无限的,不可数的。 8、样本 (sample) :从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容 量或样本量 (sample size)。 9、变量(variable) :说明现象某种特征的概念,如商品销售额、性别等,变量的具体表现称 为变量值,即数据。变量基本分类可分为分类变量:说明事物类别的名称;数值型变量:说 明事物数字特征的名称。其他分类可分为随机变量与非随机变量;经验变量和理论变量。 10、平均数(mean) :是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多 的中心位置,易受极端值的影响,是反映数据集中趋势的一项指标。它包括算术平均数、加 权算术平均数、调和平均数和几何平均数。 11、众数(mode) :是指一组数据中出现次数最多的变量值(数据值),不受极端值的影响, 一组数据可能没有众数或有几个众数。众数适合于数据量较多时,并且在数据分布偏斜程度 较大且有明显峰值时应用。 12、中位数(median) :是另外一种反映数据的中心位置的指标,其确定方法是将所有数据 以由小到大的顺序排列,位于中央的数据值就是中位数,不受极端值的影响。中位数在数据 分布偏斜程度较大时应用。 13、四分位数(quartile) :一组数据中,把所有数值由小到大排列并分成四等份,处于三个 分割点位置的数据就是四分位数,不受极端值的影响。四分位数在统计学中的箱线图绘制方 面应用较为广泛。 14、算术平均数(Arithmetic mean)简称平均数、均数或均值,是指在一组数据中所有数据之 和再除以数据的个数。它是反映数据集中趋势的一项指标。算术平均数易受极端数据的影响, 这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。 15、加权平均数(Weighted mean)是不同比重数据的平均数,加权平均数就是把原始数据按 精品资料 照合理的比例来计算。加权算术平均数主要用于处理经分组整理的数据。加权算术平均数同 时受到两个因素的影响,一个是各组数值的大小,另一个是各组分布频数的多少。 16、调和平均数(Harmonic mean) 调和平均数是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。调和平均数易 受极端值的影响,且受极小值的影响比受极大值的影响更大。只要有一个变量值为零,就不 能计算调和平均数。调和平

文档评论(0)

152****1430 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档