小样本统计理论起源与发展.pdfVIP

  • 1
  • 0
  • 约1.61千字
  • 约 2页
  • 2026-02-02 发布于北京
  • 举报

戈塞特是小样本统计理论的开创者.戈塞特在酿酒公司工作中发现,供酿酒的每批质量

相差很大,而同一批中能抽样供试验的又很少,每批样本在不同的温度下做实验,

其结果相差很大.这样一来,实际上取得的样本,不可能是大样本,只能是小样本.可是,从

小样本来分析数据是否可靠?误差有多大?小样本理论就在这样的背景下应运而生.1905

年,戈塞特利用酒厂里大量的小样本数据写了第一篇《误差法则在酿酒过程中的应用》,在此

基础上,1907年戈塞特决心把小样本和大样本之间的差别搞清楚.为此,他试图把一个总体中

的所有小样本的平均数的分布刻画出来.做法是,在一个大容器里放了一批纸牌,把它们弄

乱,随机地抽若干张,对这一样本做实验记录观察值,然后再把纸牌弄乱,抽出几张,对相应的样

本再做实验观察,记录观察值.大量地记录这种随机抽样的小样本观察值,就可

借以获得小样本观察值的分布函数若观察值是平均数,戈塞特把它叫做分布函数年,

戈塞特以“学生()”为笔名在《生物计量学》了《平均数的规律误差》这

篇开创了小样本统计理论的先河,为研究样本分布理论奠定了重要基础被统计学家誉

为统计推断理论发展史上的里程碑戈塞特这项成果,不仅不再依靠近似计算,而且能用所

谓小样本来进行推断,并且还成为使统计学的对象由现象转变为随机现象的转机换句

话说,总体应理解为含有未知参数的概率分布(总体分布)所定义的概率空间;要根据样本来

推断总体,还必须强调样本要从总体中随机地抽取,也就说,一定要是随机样本但是,应该指

出:戈塞特推导分布的方法是极的,后来费希尔利用维几何方法给出了完整的证

明;另外,戈塞特的小样本理论,一时未获承认

在统计学中,一个概率样本的置信区间(Confidenceinterval)是对这个样本

的某个总体参数的区间估计。置信区间展现的是这个参数的值有一定概率落在

测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即

前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次

大选中的支持率为55%,而置信水平0.95上的置信区间是(50%,60%),那

么他的支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因

此他的支持率不足一半的可能性小于百分之2.5(假设分布是对称的)。

如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信区间

也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情

形的估计来说,置信水平越高,所对应的置信区间就会越大。

对置信区间的计算通常要求对估计过程的假设(因此属于参数统计),比如说假

设估计的误差是成正态分布的。

置信区间只在频率统计中使用。在贝叶斯统计中的对应概念是可信区间。但是可

信区间和置信区间是建立在不同的概念基础上的,因此一般上说取值不会一样。

置信空间表示通过计算估计值所在的区间。置信水平表示准确值落在这个区间

的概率。置信区间表示具体值范围,置信水平是个概率值。例如:估计某件事

件完成会在10~12日之间,但这个估计准确性大约只有80%:表示置信区间

(10,12),置信水平80%。要想提高置信水平,就要放宽置信空间。

文档评论(0)

1亿VIP精品文档

相关文档