- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
七、哥色特和t分布①
哥色特,其笔名 Student 比他的真名更为人所知. 奈曼曾指出,许多统计学家在哥色特
于 1937 年去世后,尚不知他就是 Student, 因此我们也从众,在下文中用 Student 来称呼他.
哥色特 1876 年出生于坎特伯雷. 他曾在温彻斯特大学和牛津大学就读. 1899 年作为一
名酿酒师进入爱尔兰的都柏林一家啤酒厂工作,在那里他涉及到有关酿造过程的数据处理问
题.
1906 到 1907 年他有 1 年的时间去皮尔逊那里学习和研究统计学. 他着重关心的是由人
为试验下所得的少量数据的统计分析问题,在当时这是一个全新的课题,因为如前面曾指出
的,当时统计学中占主导地位的卡尔·皮尔逊学派强调的是由自然观察得来的大量数据的统
计处理.
这一研究的成果,就是前面曾多次讲到过的那篇使他名垂统计史册的论文《均值的或然
误差》(以下简称《均》),发表于 1908 年的《生物计量》杂志上. 如现在所周知的,他在文
2
中提出了如下的结果:设x ,…,x 是抽自正态分布N(a,σ) 的随机样本,a和σ都未知. 记
1 n
1
n 2
⎛ 2 ⎞
⎜∑(xi −x ) ⎟
s ⎜ i 1 ⎟
n ⎜ n −1 ⎟ n x −a
x ∑xi ⎜ ( ) ⎟ ( ) ①
i 1 , ⎝ ⎠ . 则 s 服从自由度n−1 的t分布tn−1 .
《均》文一开始有一段很长的导言,说明他考虑这个问题的动因,大略是:总所周知,
x
当样本量很大时,基于正态(即认 s 为正态分布⎯本书作者注)的方法是可信的,但没有
人很清楚地告诉过我们:样本量的“大”和“小”的界限在哪里,而本文的目的是定出这样
x 1
的一个界限. 正文的主要内容有:推导出 s 的分布;计算出其标准差为 n −3 及峰度系数为
n −1
3 + 2 3 + 6 ( ) x
(n −5) (应为 (n −5). 又:tn−1的标准差为 (n −3) . 我们要记住Student讨论的 s 与tn−1
x
的差别);计算了一个小型的( s 的)分布表如下所示,最后给了几个实用例子:
① 早期统计文献习惯用“Student分布”这个称呼. 用t表示Student的统计量,大概始于 1924 年费歇尔的文章
x
① 在Student的原文中,他设a =0 (这无关宏旨). 他的s的定义中,分母是n而非n -1. 又他考虑 s 的分布而
nx x
非 s 的分布. 由于这些差异,他讨论的变量 s 是t变量tn-1除以 n −1
文档评论(0)