从抛硬币试验看概率论的基本内容及统计方法.doc

从抛硬币试验看概率论的基本内容及统计方法.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从抛硬币试验看概率论的基本内容及统计方法

从抛硬币试验看概率论的基本内容及统计方法 分类: 数学 2012-12-06 13:07 301人阅读 评论(0) 收藏 举报 概率 目录(?)[+] 概率的存在性 概率模型 古典概型 公理化概率 度量与估计概率 频率估计 大数定律 最大似然估计 显著性及假设检验 评估显著性 中心极限定理 假设检验 总结 一般说到概率,就喜欢拿抛硬币做例子。大多数时候,会简单认为硬币正背面的概率各为二分之一,其实事情远没有这么简单。这篇文章会以抛硬币试验为例子并贯穿全文,引出一系列概率论和数理统计的基本内容。这篇文章会涉及的有古典概型、公理化概率、二项分布、正态分布、最大似然估计和假设检验等一系列内容。主要目的是以抛硬币试验为例说明现代数学观点下的概率是什么样子以及以概率论为基础的一些基本数理统计方法。 概率的存在性 好吧,首先我们要回答一个基本问题就是概率为什么是存在的。其实这不是个数学问题,而是哲学问题(貌似一般存在不存在啥的都是哲学问题)。之所以要先讨论这个问题,是因为任何数学活动都是在一定哲学观点前提下进行的,如果不明确哲学前提,数学活动就无法进行了(例如如果在你的哲学观点下概率根本不存在,那还讨论啥概率论啊)。 概率的存在是在一定哲学观点前提下的,我不想用哲学术语拽文,简单来说,就是你首先得承认事物是客观存在的,并可以通过大量的观察和实践被抽象总结。举个例子,我们经常会讨论“身高”,为什么我们都认为身高是存在的?因为我们经过长期的观察实践发现一个人身体的高度在短期内不会出现大幅度的变动,因此我们可以用一个有单位的数字来描述一个人的身体在一段不算长的时间内相对稳定的高度。这就是“身高”作为被普遍承认存在的哲学前提。 与此相似,人们在长期的生活中,发现世界上有一些事情的结果是无法预料的,例如抛硬币得到正面还是背面,但是,后来有些人发现,虽然单次的结果不可预料,但是如果我不断抛,抛很多次,正面结果占全部抛硬币次数的比率是趋于稳定的,而且次数越多越接近某个固定的数值。换句话说,抛硬币这件事,单次结果不可预料,但是多次试验的结果却在总体上是有规律可循的(术语叫统计规律)。 下面是历史上一些著名的抛硬币试验的数据记录: 试验者 试验次数 正面次数 正面占比 德摩根 4092 2048 50.05% 蒲丰 4040 2048 50.69% 费勒 10000 4979 49.79% 皮尔逊 24000 12012 50.05% 罗曼洛夫斯基 80640 39699 49.23% 可以看到,虽然这些试验在不同时间、不同地点由不同的人完成,但是冥冥中似乎有一股力量将正面的占比固定在50%附近。 后来,人们发现还有很多其它不可预测的事情都与抛硬币类似,例如掷骰子、买六合彩等等,甚至渐渐发现不只这些简单的事情,人类社会方方面面从简单到复杂的很多不可预测的事情宏观上看都具有统计规律。于是人们推测,在某些条件下的一些不可预测事件,都是有统计规律的,或者直观说很多不可预测结果的试验在多次进行后总体上看结果会趋近于一些常数(这个现象后来被严格定义为大数定律,成为概率论最基础的定理之一,下文会提到)。这种可观测现象,成为概率存在的哲学基础,而这些常数就是概率在朴素观点下的定义。 概率模型 在认识到上述事实后,人们希望将这种规律加以利用(人类文明的发展不就是发现和利用规律么,呵呵),但是想要利用就首先要对概率进行严格的形式化定义,也就是要建立数学模型。比较知名的数学模型有古典概型、几何概率模型和公理化概率,本文将会讨论古典概型和公理化概率。 古典概型 古典概型是人类对概率和统计规律最早的建模尝试,表达了朴素的数学原则下人们对概率的认识。在表述古典概型之前,需要先定义一些概念。 首先是随机试验。 如果一个同时试验满足下面三条原则,则这个试验称为随机试验: 1、可在相同条件下(相对来说)重复进行。 2、可能出现的结果不止一个,但事先明确知道所有可能的结果(可以是无限个,例如所有自然数,但必须事先明确知道结果的取值范围)。 3、事先无法预测在一次试验中哪一个结果会出现。 显然上面的抛硬币试验是一个随机试验。 然后需要定义样本空间和样本点。一个随机试验的样本空间是这个试验所有可能结果组成的集合,而其中每个元素是一个样本点。例如,抛硬币试验中,样本空间为{F,B} ,其中F表示正面,B表示背面,而F、B就是两个样本点。 另一个非常重要的概念就是随机事件(简称事件):样本空间的一个子集称为一个事件。例如,抛硬币试验有四个不同的事件:? ,{F} ,{B} ,{F,B} ,分别表示“既不出现正面也不出现反面”,“出现正面”,“出现反面”和“出现正面或反面”。在不考虑硬币立起来等特殊情况时,第一个事件不可能出现,但它确实是一个合乎定义的事件,叫不可能事件;而最后一个事

文档评论(0)

dfg832 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档