贝叶斯统计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
英国学者T.贝叶斯1763年在《论有关机遇问题的求解》中提出一种归纳推理的理论,后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。贝叶斯的基本观点:1.认为未知参数是一个随机变量,而非常量。2.在得到样本以前,用一个先验分布来刻画关于未知参数的信息。3. 贝叶斯的方法是用数据,也就是样本,来调整先验分布,得到一个后验分布。4.任何统计问题都应由后验分布出发。 统计推断中主要有三种信息,一是总体信息,即总体分布或总体所属分布族给我们的信息;二是样本信息,即总体中抽取的样本给我们提供的信息;三是先验信息,即抽样之前有关统计问题的一些信息。贝叶斯学派和经典学派的不同在于对统计推断的三种信息使用的不同,基于前两种信息的统计推断称为经典统计学,它的基本观点是把数据看成是来自具有一定分布的总体,所研究的对象是这个总体而不局限于数据本身。基于以上三种信息进行的统计推断被称为贝叶斯统计学。它与经典统计学的主要差别在于是否利用先验信息,在使用样本信息上也是有差异的。 贝叶斯学派的最基本的观点是:任何一个未知量 都可看作一个随机变量,应用一个概率分布去描述对的未知状况。这个概率分布是在抽样前就有的关于的先验信息的概率陈述。因为任一未知量都有不确定性,而在表述不确定性程度时,概率与概率分布是最好的语言。这个概率分布就被称为先验分布。贝叶斯学派认为先验分布不必有客观的依据,它可以部分地或完全地基于主观信念。这个是经典学派与贝叶斯学派争论的一个焦点,经典学派认为经典统计学是用大量重复试验的频率来确定概率、是“客观”的,因此符合科学的要求,而认为贝叶斯统计是“主观的”,因而只对个人做决策有用。这是当前对贝叶斯统计的主要批评。贝叶斯学派认为引入主观概率及由此确定的先验分布至少把概率与统计的研究与应用范围扩大到了不能大量重复的随机现象中来。其次,主观概率的确定不是随意的,而是要求当事人对所考察的事件有较透彻的了解和丰富的经验,甚至是这一行的专家,在这个基础上确定的主观概率就能符合实际。 若仅仅研究先验分布贝叶斯统计也就没大意思了,与先验分布对应的还有后验分布。我们先来看一下后验分布的定义,在样本给定下的条件分布被称为的后验分布。我们分析一下这句话,首先可以明白后验分布是一个条件分布,怎样的条件分布呢,在样本给定的条件下的条件分布,看来仍然是需要样本,在贝叶斯统计中的样本又是什么样子的呢?从贝叶斯观点看,样本的产生主要分两步。首先设想从先验分布产生一个样本,这一步是“老天爷”做的,人们是看不见得,故用“设想”二字。第二步是从总体分布产生一个样本,这个样本是具体的,人们能看的到的,此时样本发生的概率与如下联合密度函数成正比 这个联合密度函数综合了总体信息与样本信息,常被称为似然函数,及为.由于是设想出来的,他仍然是未知的,它是按先验分布而产生的,要把先验分布进行综合,不能只考虑,而应对 的所有可能加以考虑。这样一来就有了样本与参数的联合分布 把先验信息,总体信息,样本信息都综合进去了。 我们在是件形式初等概率中已经学过贝叶斯公式的事件形式 根据贝叶斯公式我们也可把做如下分解 这里是的边缘分布函数,与无关,不含有的任何信息。 在是离散型随机变量时,; 在是连续型随机变量时,; 这样我们就可以得到条件分布 就是给定样本下,的条件分布了,也即的后验分布。 一般说来,先验分布是反映人们在抽样前对的认识,后验分布是反映人们在抽样后对的认识。之间的差异是由于样本出现后人们对认识的一种调整。所以后验分布是集中了总体,样本和先验等三种信息中有关的一切信息后的结果。 为了更好的理解后验分布我们来看一个例子 例1:为提高某产品的质量,公司经理考虑增加投资来改进生产设备,预计需投资90万元,但从投资效果上看下属两个部门有两种意见: :改进生产设备后,高质量产品可占90% :改进生产设备后,高质量产品可占70% 经理当然希望发生,但根据两部门过去意见被采纳的情况,经理认为40%第一个部门是可信度的,60%第二个部门是可信度,即随机变量投资结果过 的先验分布列为:; 这是经理的主管意见,经理不想仅用过去的经验来决策此事,想慎重一些,通过小规模实验,观察其结果后再定。为此做了一项实验,实验结果(记为A)如下: A:试制五个产品,全是高质量产品。 经理很高兴,希望通过这次结果来修正他原来对和的看法。下面我们分别来求一下和的后验概率。 如今已有了和.还需要条件概率和,这可根据二项分布算的, ; 由全概率公式可算的 最后由后验分布公式可求得: 这表明,纪理根据实验A的信息调整了自己对投资结果的看法,把对和的信任度由0.4,和0.6分别调整到了0.7和0.3。后者综合了经理的主观概率和实验结果而获得,要比主观概率更具有吸引力,更贴近当前实际。当然经过实验A后经理对投资改进质量

文档评论(0)

精品资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档