正态分布介绍讲义.docxVIP

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正态分布是自然科学与行为科学中的定量现象的一个方便模型。各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布。尽管这些现象的根本原因经常是未知的,理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布(在R.N.Bracewell的Fourier transform and its application中可以找到一种简单的证明)。正态分布出现在许多区域统计:例如,采样分布均值是近似地常态的,即使被采样的样本的原始群体分布并不服从正态分布。另外,正态分布信息熵在所有的已知均值及方差的分布中最大,这使得它作为一种均值以及方差已知的分布的自然选择。正态分布是在统计以及许多统计测试中最广泛应用的一类分布。在概率论,正态分布是几种连续以及离散分布的极限分布。 历史[编辑] 正态分布最早是棣莫弗在1718年著作的书籍的(Doctrine of Change),及1734年发表的一篇关于二项分布文章中提出的,当二项随机变量的位置参数n很大及形状参数p为1/2时,则所推导出二项分布的近似分布函数就是正态分布。拉普拉斯在1812年发表的《分析概率论》(Theorie Analytique des Probabilites)中对棣莫佛的结论作了扩展到二项分布的位置参数为n及形状参数为1p0时。现在这一结论通常被称为棣莫佛-拉普拉斯定理。 拉普拉斯在误差分析试验中使用了正态分布。勒让德于1805年引入最小二乘法这一重要方法;而高斯则宣称他早在1794年就使用了该方法,并通过假设误差服从正态分布给出了严格的证明。 “钟形曲线”这个名字可以追溯到Jouffret他在1872年首次提出这个术语钟形曲面,用来指代二元正态分布(bivariate normal)。正态分布这个名字还被Charles S. Peirce、Francis Galton、Wilhelm Lexis在1875分别独立地使用。这个术语是不幸的,因为它反应和鼓励了一种谬误,即很多概率分布都是常态的。(请参考下面的“实例”) 这个分布被称为“常态”或者“高斯”正好是Stigler名字由来法则的一个例子, 这个法则说“没有科学发现是以它最初的发现者命名的”。 正态分布的定义[编辑] 有几种不同的方法用来说明一个随机变量。最直观的方法是概率密度函数,这种方法能够表示随机变量每个取值有多大的可能性。累积分布函数是一种概率上更加清楚的方法,请看下边的例子。还有一些其他的等价方法,例如cumulant、特征函数、动差生成函数以及cumulant-生成函数。这些方法中有一些对于理论工作非常有用,但是不够直观。请参考关于概率分布的讨论。 概率密度函数[编辑] 四个不同参数集的概率密度函数(绿色线代表标准正态分布) 正态分布的概率密度函数均值为?方差为?(或标准差)是高斯函数的一个实例: 。 (请看指数函数以及.) 如果一个随机变量服从这个分布,我们写作??~?. 如果并且,这个分布被称为标准正态分布,这个分布能够简化为 。 右边是给出了不同参数的正态分布的函数图。 正态分布中一些值得注意的量: 密度函数关于平均值对称 平均值与它的众数(statistical mode)以及中位数(median)同一数值。 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。 95.449974%的面积在平均数左右两个标准差的范围内。 99.730020%的面积在平均数左右三个标准差的范围内。 99.993666%的面积在平均数左右四个标准差的范围内。 函数曲线的反曲点(inflection point)为离平均数一个标准差距离的位置。 累积分布函数[编辑] 上图所示的概率密度函数的累积分布函数 累积分布函数是指随机变量小于或等于的概率,用概率密度函数表示为 正态分布的累积分布函数能够由一个叫做误差函数的特殊函数表示: 标准正态分布的累积分布函数习惯上记为,它仅仅是指,时的值, 将一般正态分布用误差函数表示的公式简化,可得: 它的反函数被称为反误差函数,为: 该分位数函数有时也被称为probit函数。probit函数已被证明没有初等原函数。 正态分布的分布函数没有解析表达式,它的值可以通过数值积分、泰勒级数或者渐进序列近似得到。 生成函数[编辑] 动差生成函数[编辑] 动差生成函数或矩生成函数或动差产生函数被定义为的期望值。 正态分布的动差产生函数如下: ? ? 可以通过在指数函数内配平方得到。 特征函数[编辑] 特征函数被定义为的期望值,其中是虚数单位. 对于一个常态分布来讲,特征函数是: ? ? 把矩生成函数中的换成就能得到特征函数。 性质[编辑] 正态分布的一些性质: 如果且与是实数,那么?(参见期望值和方差). 如果与是统计独立的常态随机变量,那么: 它们

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档