统计学常用基本公式(9页).docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

统计学常用基本公式

第一部分:描述性统计

1.平均数(Mean)

平均数是一组数据的总和除以数据个数,用来描述数据的中心位置。公式如下:

$$

\text{平均数}=\frac{\sum_{i=1}^{n}x_i}{n}

$$

其中,$x_i$表示第$i$个数据,$n$表示数据个数。

2.中位数(Median)

中位数是将一组数据按照大小顺序排列后,位于中间位置的数值。如果数据个数为奇数,则中位数是中间的数值;如果数据个数为偶数,则中位数是中间两个数值的平均数。

3.众数(Mode)

众数是一组数据中出现次数最多的数值。一组数据可能有一个众数、多个众数或没有众数。

4.标准差(StandardDeviation)

标准差是一组数据与其平均数之差的平方和的平方根,用来描述数据的离散程度。公式如下:

$$

\text{标准差}=\sqrt{\frac{\sum_{i=1}^{n}(x_i\bar{x})^2}{n}}

$$

其中,$\bar{x}$表示平均数。

5.方差(Variance)

方差是一组数据与其平均数之差的平方和的平均数,用来描述数据的离散程度。公式如下:

$$

\text{方差}=\frac{\sum_{i=1}^{n}(x_i\bar{x})^2}{n}

$$

其中,$\bar{x}$表示平均数。

6.四分位数(Quartiles)

四分位数是将一组数据按照大小顺序排列后,将数据分为四等份的三个数值。第一四分位数(Q1)表示数据中前25%的位置,第二四分位数(Q2)即中位数,第三四分位数(Q3)表示数据中前75%的位置。

7.离散系数(CoefficientofVariation)

离散系数是一组数据的标准差与平均数之比,用来描述数据的相对离散程度。公式如下:

$$

\text{离散系数}=\frac{\text{标准差}}{\text{平均数}}

$$

8.箱线图(Boxplot)

箱线图是一种用于展示数据分布的图表,通过箱体、胡须和点来表示数据的五个数值特征:最小值、第一四分位数、中位数、第三四分位数和最大值。

9.直方图(Histogram)

直方图是一种用于展示数据分布的图表,通过将数据分为若干个区间,统计每个区间内的数据个数,用矩形的高度来表示每个区间内的数据个数。

10.频率分布表(FrequencyDistributionTable)

频率分布表是一种用于展示数据分布的表格,通过将数据分为若干个区间,统计每个区间内的数据个数,用表格的形式展示每个区间内的数据个数。

统计学常用基本公式

第二部分:推论统计

1.点估计(PointEstimation)

点估计是用样本数据的一个数值来估计总体参数的值。常用的点估计方法包括矩估计、最大似然估计等。

2.区间估计(IntervalEstimation)

区间估计是用样本数据来估计总体参数的可能取值范围。常用的区间估计方法包括置信区间、预测区间等。

3.置信区间(ConfidenceInterval)

置信区间是在一定的置信水平下,用来估计总体参数的可能取值范围。公式如下:

$$

\text{置信区间}=\text{点估计}\pm\text{置信水平}\times\text{标准误差}

$$

其中,标准误差是样本标准差除以样本量的平方根。

4.假设检验(HypothesisTesting)

假设检验是用来判断样本数据是否支持某个关于总体的假设。常用的假设检验方法包括t检验、F检验、卡方检验等。

5.t检验(ttest)

t检验是用来比较两个样本均值是否存在显著差异的方法。公式如下:

$$

t=\frac{\bar{x}_1\bar{x}_2}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

$$

其中,$\bar{x}_1$和$\bar{x}_2$分别表示两个样本的均值,$s_1^2$和$s_2^2$分别表示两个样本的方差,$n_1$和$n_2$分别表示两个样本的样本量。

6.F检验(Ftest)

F检验是用来比较两个样本方差是否存在显著差异的方法。公式如下:

$$

F=\frac{s_1^2}{s_2^2}

$$

其中,$s_1^2$和$s_2^2$分别表示两个样本的方差。

7.卡方检验(ChisquareTest)

卡方检验是用来比较两个分类变量之间是否存在显著关联的方法。公式如下:

$$

\chi^2=\sum_{i=1}^{k}\frac{(O_iE_i)^2}{E_i}

$

文档评论(0)

黄博衍 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档