- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正态分布的前世今生分析
正态分布的前世今生
一、正态分布,熟悉的陌生人
学过基础统计学的同学大都对正态分布非常熟悉。这个钟型的分布曲线不但形状优雅,
其密度函数写成数学表达式
12π−−√σexp(−(x−μ)22σ2)
也非常具有数学的美感。其标准化后的概率密度函数
12π−−√exp(−x22)
更加的简洁漂亮,两个最重要的数学常量π,e 都出现在了公式之中。在我个人的审美之中,
它也属于top-N 的最美丽的数学公式之一,如果有人问我数理统计领域哪个公式最能让人感觉
到上帝的存在,那我一定投正态分布的票。因为这个分布戴着神秘的面纱,在自然界中无处不
在,让你在纷繁芜杂的数据背后看到隐隐的秩序。
【正态分布曲线】
正态分布又通常被称为高斯分布,在科学领域,冠名权那是一个很高的荣誉。早年去
过德国的兄弟们还会发现,德国的钢镚和 10 马克的纸币上都留有高斯的头像和正态密度
曲线。正态分布被冠名高斯分布,我们也容易认为是高斯发现了正态分布,其实不然,不
过高斯对于正态分布的历史地位的确立是起到了决定性的作用。
1
【德国马克上的高斯头像和正态分布曲线】
正态曲线虽然看上去很美,却不是一拍脑袋就能想到的。我们在本科学习数理统计的
时候,课本一上来介绍正态分布就给出密度分布函数,却从来不说明这个分布函数是通过
什么原理推导出来的。所以我一直搞不明白数学家当年是怎么找到这个概率分布曲线的,
又是怎么发现随机误差服从这个奇妙的分布的。我们在实践中大量的使用正态分布,却对
这个分布的来龙去脉知之甚少,正态分布真是让人感觉既熟悉又陌生。直到我读研究生的
时候,我的导师给我介绍了陈希儒院士的《数理统计学简史》这本书,看了之后才了解了
正态分布曲线从发现到被人们重视进而广泛应用,也是经过了几百年的历史。
正态分布的这段历史是很精彩的,我们通过讲一系列的故事来揭开她的神秘面纱。
二、邂逅,正态曲线的首次发现
第一个故事和概率论的发展密切相关,主角是棣莫弗(De Moivre)和拉普拉斯
(Laplace)。拉普拉斯是个大科学家,被称为法国的牛顿;棣莫弗名气可能不算很大,不
过大家应该都熟悉这个名字,因为我们在高中数学学复数的时候我们都学过棣莫弗定理
(cosθ+isinθ)n=cos(nθ)+isin(nθ).
古典概率论发源于赌博,惠更斯、帕斯卡、费马、贝努利都是古典概率的奠基人,他们那
会研究的概率问题大都来自赌桌上,最早的概率论问题是赌徒梅累在 1654 年向帕斯卡提出的
如何分赌金的问题。统计学中的总体均值之所以被称为期望(Expectation),就是源自惠更斯、
帕斯卡这些人研究平均情况下一个赌徒在赌桌上可以期望自己赢得多少钱。
棣莫弗(De Moivre) 拉普拉斯 (Laplace)
2
有一天一个哥们,也许是个赌徒,向棣莫弗提了一个和赌博相关的一个问题:A,B 两
人在赌场里赌博,A,B 各自的获胜概率是p 和q=1−p ,赌n 局,若A 赢的局数X np,
则A 付给赌场X−np 元,否则B 付给赌场np−X 元。问赌场挣钱的期望值是多少?
问题并不复杂,本质上是一个二项分布,最后求出的理论结果是
2npqb(n,p ,np),
其中
b(n,p ,i)=(ni)p iqn−i
是常见的二项概率。但是对具体的n,要把这个理论结果实际计算出数值结果可不是
件容易的事,因为其中的二项公式中有组合数.这就驱动棣莫弗寻找近似计算的方法。
与此相关联的另一个问题,是遵从二项分布的随机变量X ∼B(n,p ),问X 落在二项分
布中心点一定范围的概率Pd=P(|X−np|≤d)是多少?
对于p =12 的情形,棣莫弗做了一些计算并得到了一些近似结果,但是还不够漂亮,幸
运的是棣莫
您可能关注的文档
最近下载
- 三一EBZ200悬臂式掘进机使用说明书.pdf VIP
- 教学能力比赛-教学实施报告(基础会计).pdf VIP
- 古典文献学第十章 文献的整理 : 校勘与辨伪.ppt VIP
- 学校食堂供应商评价表(参考模板).doc VIP
- 2025年广东省广州市初中学业水平考试英语试题.docx VIP
- 禁毒教育知识培训.pptx VIP
- JB-QB-FS5101火灾报警控制器_使用说明书.pdf
- 2025上半年中级软件水平考试《网络工程师(综合知识)》新版真题卷(附详细解析).docx VIP
- 新人教版小学六年级数学上册教学课件(全册).pptx VIP
- 中小学校教师师德师风专题培训讲座PPT课件.pptx VIP
文档评论(0)