统计量及其分布.pptVIP

  • 62
  • 0
  • 约5.15千字
  • 约 49页
  • 2017-06-05 发布于湖北
  • 举报
统计量及其分布概要

5.3.1 统计量与抽样分布 §5.3 统计量及其分布 5.3.2 样本均值及其抽样分布 定义5.3.2 设 x1, x2, …, xn为取自某总体的样本,其算术平均值称为样本均值,一般用 表示,即 样本均值的抽样分布 (例题分析) 样本均值的抽样分布 样本均值的抽样分布 所有样本均值的均值和方差 样本均值的抽样分布与总体分布的比较 定理 设总体X的期望E(X) = ? ,方差D(X) = ? 2,X1,X2,…,Xn为总体X的样本, ,S2分别为样本均值和样本方差,则 定理 设总体X的期望E(X) = ? ,方差D(X) = ? 2,X1,X2,…,Xn为总体X的样本, ,S2分别为样本均值和样本方差,则 三、表示数据分布形状的统计量 偏度和峰度是描述数据分布形状的指标。 1. 偏度(skewness) 偏度是刻画数据对称性的指标。偏度的计算公式 关于均值对称的数据其偏度为0; 均值左侧更为分散的数据,其偏度为负,称为左偏; 均值右侧更为分散的数据,其偏度为正,称为右偏。 2. 峰度(kurtosis) 峰度反映总体分布尾端散布的趋势和陡峭程度。 峰度的计算公式为: 利用峰度研究数据分布的形状是以正态分布为标准 近似于标准正态分布,则峰度接近于零; 数据中含有较多远离均值的极端数值,则峰度为正,称为细尾。分布密度曲线较陡 数据中如果均值两侧的极端数值较少,则峰度为负,称为粗尾。分布密度曲线较平缓 箱线图 (箱线图的构成) 分布的形状与箱线图 Have students verify these numbers. 推论1 :最大次序统计量 x (n) 的概率密度函数为 推论2 :最小次序统计量 x (1) 的概率密度函数为 例 :设总体X 的密度函数为 现从该总体中抽得一个容量为 5 的样本,试计算 解: 我们首先应求出 x (2) 的分布。由总体密度函数不难求出总体分布函数为 可以得到 x (2) 的密度函数为 于是 (二)多个次序统计量的联合分布 仅讨论任意二个次序统计量的情形。 定理 :设总体 ξ 有密度函数 f (x) , a ≤x ≤b , (同样可设 a = - ∞, b = +∞ ) 。并且 X1 , X2 , … , Xn 是取自这一总体的一个样本,则其任意两个次序统计量 X (i) X (j) 的联合分布密度函数为 (5-3-16) 证明:对增量 ?y, ?z 以及 y z , 事件 可以表述为“容量为 n 的样本 x1, x2, … , xn 中有 i-1 个观测值小于等于 y , 一个落入区间 ( y , y + ?y ] , j –i -1 个落入区间 ( y + ?y , z ] , 一个落入区间 ( z, z+?z ] ,而余下的 n—j 个大于 z + ? z ” i-1 1 j-i-1 1 n-j 于是由多项分布得 i-1 1 j-i-1 1 n-j i-1 1 j-i-1 1 n-j i-1 1 j-i-1 1 n-j y y+?y z z+?z i-1 1 j-i-1 1 n-j 考虑到 F (x) 的连续性,当 有 于是 定理 证明省略 次序统计量的函数在实际中经常用到。 如 样本极差 Rn = x(n) ? x(1), 样本中程 [x(n) ? x(1)]/2。 样本极差是一个很常用的统计量,其分布只在很少几种场合可用初等函数表示。 例:设总体分布为 U ( 0 , 1 ) , x1, x2, … , xn 为样本,则 ( x (1) , x (n) )的联合密度函数为 令 由 R 0 可以推出

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档