贝叶斯统计简介.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抛出一枚硬币,硬币落地,现在我不知道结果如何,问是正面朝上还是反面朝上? 答案有三个:A 正面朝上、B 反面朝上、C 正面朝上反面朝上的概率各占1/2 哪个正确? 经典统计学里面正确答案能是A或者B,只有在贝叶斯统计学里面答案C是才是被允许的 一次实验的结果在经典统计学里面被叫做样本点,是确定的。 那么为什么在贝叶斯统计学里面第三个的答案的说法是正确的呢? 关键在于贝叶斯学派关于随机变量的定义:任何一个未知量*都可以看做一个随机变量。 这也是贝叶斯学派最基本的观点,只要是未知的量都可以看做随机变量。 仅仅从这一个简单的例子就已经可以看到经典统计学派与贝叶斯统计学派的争议来了,其实两个学派在一些问题上的争论是相当深刻而激烈的,当然也有相同相通之处,在这里就不便展开详细的讨论了。就我本人还是比较倾向于贝叶斯学派的。 我们在回到上面的问题,看答案C正面朝上反面朝上的概率各占1/2,仔细想想这句话,实际上我们已经给出了未知量(本次实验结果)一个概率分布的描述。要么正面朝上要么反面朝上,概率各占1/2,这个概率分布被叫做先验分布。先验分布是指根据先验信息所给出的随机变量的分布,这里的先验信息是指在抽样之前有关统计问题的一些信息。那么先验分布与经典统计学里面的概率分布有什么区别呢?在所要满足的条件上,如……是一致的,主要区别在与概率分布得到的途径上。经典统计学里概率及其分布的确定来自大量重复实验,与频率密切相关,由大数定律、中心极限定理这些基本定理做为理论基石而得来。特别强调的是经典统计学的概率分布包含了所有样本点,即所有可能的实验结果都要被包含进去。这是与贝叶斯统计学里的先验分布不同的地方,贝叶斯统计学的先验概率分布来自于过去的经验,这里之所以加上”过去的“三个字并且对其强调,是想告诉大家先验分布只考虑已出现的样本点,不是所有的样本点。并且可以由经验而来不必做大量的重复实验。在这一点上克服了经典统计学的一些局限性,使得我们的研究深入到那些不适宜或不能大量重复的随机现象中来。当然这也使先验分布带有的主观性色彩。关于这一点也是一个经典统计学与贝叶斯统计学的一个争议点,有很多深入的问题正在探讨中。在这里我们就不讨论了。 若仅仅研究先验分布贝叶斯估计也就没大意思了,与先验分布对应的还有后验分布。我们先来看一下后验分布的定义,在样本给定下的条件分布被称为的后验分布。我们分析一下这句话,首先可以明白后验分布是一个条件分布,怎样的条件分布呢,在样本给定的条件下的条件分布,看来仍然是需要样本,在贝叶斯统计中的样本又是什么样子的呢?从贝叶斯观点看,样本的产生主要分两步。首先设想从先验分布产生一个样本,这一步是“老天爷” 做的,人们是看不见得,故用“设想”二字。第二步是从总体分布产生一个样本,这个样本是具体的,人们能看的到的,此时样本发生的概率与如下联合密度函数成正比 这个联合密度函数综合了总体信息与样本信息,常被称为似然函数,及为.由于是设想出来的,他仍然是未知的,它是按先验分布而产生的,要把先验分布进行综合,不能只考虑,而应对 的所有可能加以考虑。这样一来就有了样本与参数的联合分布 把先验信息,总体信息,样本信息都综合进去了。 我们在是件形式初等概率中已经学过贝叶斯公式的事件形式 根据贝叶斯公式我们也可把做如下分解 这里是的边缘分布函数,与无关,不含有的任何信息。 在是离散型随机变量时,; 在是连续型随机变量时,; 这样我们就可以得到条件分布 就是给定样本下,的条件分布了,也即的后验分布。 可以说后验分布是对先验分布的调整,它是集中了总体,样本和先验等三种信息中有关的一切信息后的结果。 为了更好的理解后验分布我们来看一个例子 例1:为提高某产品的质量,公司经理考虑增加投资来改进生产设备,预计需投资90万元,但从投资效果上看下属两个部门有两种意见: :改进生产设备后,高质量产品可占90% :改进生产设备后,高质量产品可占70% 经理当然希望发生,但根据两部门过去意见被采纳的情况,经理认为40%第一个部门是可信度的,60%第二个部门是可信度,即随机变量投资结果过 的先验分布列为:; 这是经理的主管意见,经理不想仅用过去的经验来决策此事,想慎重一些,通过小规模实验,观察其结果后再定。为此做了一项实验,实验结果(记为A)如下: A:试制五个产品,全是高质量产品。 经理很高兴,希望通过这次结果来修正他原来对和的看法。下面我们分别来求一下和的后验概率。 如今已有了和.还需要条件概率和,这可根据二项分布算的, ; 由全概率公式可算的 最后由后验分布公式可求得: 这表明,纪理根据实验A的信息调整了自己对投资结果的看法,把对和的信任度由0.4,和0.6分别调整到了0.7和0.3。后者综合了经理的主观概率和实验结果而获得,要比主观概率更具有吸引力,更贴近当前实际

文档评论(0)

精品资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档