- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
决策理论与方法讲义2
2.3 贝叶斯决策 贝叶斯基本原理,又称贝叶斯定理(Bayes theorem),是贝叶斯决策理论的根基。贝叶斯基本原理是概率论中的一个结果,它跟随机变量的条件概率以及边际概率分布有关。在有些关于概率的解说中,贝叶斯定理能够告诉我们如何利用新证据修改已有的看法。作为一个规范的原理,贝叶斯定理对于所有概率的解释是有效的。通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。 两事件 同时发生的概率遵循如下的乘法法则: 如果事件 和 是完全互斥的,则有边际概率: 2.3 贝叶斯决策 如果事件 和 是完全互斥的,其中某个事件的发生是事件 发生的必要条件。则两事件的发生遵循如下的贝叶斯定理公式: 同理可知,如果事件 是完全互斥的,其中某个事件的发生是事件 发生的必要条件,那么 个事件的贝叶斯定理公式就为: 2.3 贝叶斯决策 贝叶斯决策的意义 决策问题与人的生活密不可分,小到一个行动方案的决定,大至国家大政方针的制定,都属于决策问题。对于一些具有确定性的决策问题,像“货郎担问题”,利用数学规划的知识可以很好地解决,但对于具有不确定性的问题,比如根据某产品以前几个月的销售情况,来决定下一个月的生产数量问题,就需要用到统计决策方法,这时贝叶斯决策是一种很好的决策方法。 决策问题的一般特点是: (1)决策者面临多种决策行动方案有待选择,即可采取的决策方案不唯一; (2)所选择的决策方案实施后果的价值待定; (3)自然状态的不确定性,由此造成决策方案结果的不确定。 2.3 贝叶斯决策 用贝叶斯决策可以拥有一般决策方法所不具有的优势。首先,一般的决策方法大多用的是不完备的信息或主观概率,而贝叶斯决策能对信息的价值或是否需要采集新的信息做出科学的判断。它能对调查结果的可能性加以数量化的评价,而不是像一般的决策方法那样,对调查结果或者是完全相信,或者是完全不相信。其次,如果说任何调查结果都不可能完全准确,先验知识或主观概率也不是完全可以相信的,那么贝叶斯决策则巧妙地将这两种信息有机地结合起来了。它可以在决策过程中根据具体情况下不断地使用,使决策逐步完善和更加科学。但同时贝叶斯决策也具有自身不可避免的局限性,如它需要的数据多,分析计算比较复杂,特别在解决复杂问题时,这个矛盾就更为突出;而且有些数据必须使用主观概率,有些人不太相信,这也妨碍了贝叶斯决策方法的推广和使用。 2.3 贝叶斯决策 2.3.2 贝叶斯决策方法 1.贝叶斯决策的基本方法 贝叶斯决策可以通过以下步骤来进行: (1)验前分析。 (2)预验分析。 (3)验后分析。 (4)序贯分析。 2.3 贝叶斯决策 2.3.2 贝叶斯决策方法 2.贝叶斯风险与原则 在进行贝叶斯决策细致深入研究之前,我们首先需要定义决策过程中的几个重要的变量,并了解贝叶斯决策所遵循的原则。 定义2.3.1 报酬:报酬为某个自然状态下采用某个决策后所产生的利润结果。所有利润结果的集合称为报酬集,记为R。由于结果具有不确定性,所以行动的结果通常以R上某一概率分布的形式出现。令P表示所有这些概率分布的集合。 定义2.3.2 损失:损失表示对应于某一自然状态和某一决策方案下,采取某种行动所产生的不良后果。 定义2.3.3 贝叶斯期望损失(又称后验风险)。贝叶斯期望损失是指: 2.3 贝叶斯决策 2.3.2 贝叶斯决策方法 定义2.3.4 决策规则:决策规则 为一个从信息集A到行动集的函数,表示根据信息x所作的决策。若对所有 的有 ,则两个决策 和 被认为是相等的。 定义2.3.5 风险函数:决策规则 的风险函数定义为 2.3 贝叶斯决策 定义2.3.6 贝叶斯风险:一个决策规则 关于 上的先验分布 的贝叶斯风险是指 这里 表示关于自然状态 的最初信息的概率分布函数,故又称为自然状态 的先验概率分布。在这里,先验信息的选取对决策非常重要,它的选取方法主要有以下几类:根据历史资料或者相似事件的信息获得,尤其曾经做过的实验数据的资料;理论分析或者通过计算机模拟获得该方法经常在工程实践中应用到;凭借主观经验的“主观概率”估计方法获得,该方法最典型的是专家打分法。然后应用无信息先验法、最大熵确定法、边际分布确定法等可以确定 的先验分布。 2.3 贝叶斯决策 贝叶斯决策即寻找一行动a,使得贝叶斯期望损失达到最小(假定最小值可达),即寻找最优行动 。这一决策过程迄今为止有两种准则可以遵循即贝叶斯期望损失准则和贝
文档评论(0)