- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析统计学的起源
浅析统计学的起源
摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索
关键词:统计史;起源
引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。
任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。
在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。
古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。
在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史
应该说在我们给出的这些例子中,古人所使用的推断方法在形式上是属于推断统计学的,但这些方法没有给出有关推断结果的不确定性的说明,因此也就没有资格纳入推断统计学的范畴,否则推断统计学的早期历史将是一串横亘数千年的高度离散且相互独立的离散点。
在另一个方向上,估计线性方程组中未知参数的工作首先起源于1750年德国天文学家梅耶(1723-1762)关于月亮天平动理论的研究。他设计出一套精巧的方法用来求解包含3个未知量却有27个观测数据的方程,具体做法是:以其中一个未知量的系数为准,按各方程中此系数的大小分组,即最大的9个,最小的9个,最后剩下的9个各成一组,然后将各组方程加总,并利用加总后的三个方程求解未知量。梅耶这样做的原因是,他相信加总后方程之间的差异越大,方程解的
精度就会越高0[2]23。接下来的一个突破性的成果属于出生在拉古萨的著名学者波斯科维奇( 1711-1787)。1757年,波斯科维奇为了解决测量子午线长度问题提出了在假定误差之和为零的条件下,采用误差绝对值之和最小的求解原则。到了1787年,我们又一次看到了拉普拉斯,他在研究与梅耶类似的问题时,扩展了梅耶的方法,采用几种不同的组合方程方法来压缩方程的个数。最后是勒让德( 1752-1833),1805年他提出的最小二乘方法彻底地解决了求解方程组个数多于未知量的问题。但使上述两条主线最终汇聚在一起则要归功于德国伟大的科学家高斯( 1777-1855)。1809年高斯在其发表的天体物力学名著5天体绕日运行理论6中以出人意料的手法论证了观测误差服从正态分布,并利用拉普拉斯的逆概率方法证明了后验概率最大化与最小二乘方法的等价性。高斯的这一成就使18世纪以来的推断统计学研究达到了巅峰,随后1810年拉普拉斯利用其刚刚发现的中心极限定理对高斯的结论进行了进一步的完善,从而导致了一个革命性的拉普拉斯与高斯思想相融合的新体系的建立。
从18世纪中叶至19世纪初,古典概率已走出以赌博游戏为主要研究对
文档评论(0)