第15讲(完全信息动态博弈).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第15讲(完全信息动态博弈)

情形2:B在决策时并不确切地知道自然选择。B的信息集由原来的4个变成2个,2个信息集分别对应着B的两个不同决策:若A开发,自己是否开发;若A不开发,B是否开发。用虚线将属于同一信息集的两个决策结连接起来。 情形3:B知道自然的选择,但不知道A的选择(如B和A同时决策)。此时,B也有两个信息集,每个信息集包含两个决策结:两处信息集分别对应两种不同的决策:需求大是否开发和需求小是否开发。 情形4:B知道自然选择但不知道A的选择,A不知道自然选择。 情形5:A既不知道自然选择也不知道B的选择,但B知道自然选择。 一个信息集可能包括多个决策结,也可能只包括一个决策结,后者叫做单结信息集。 若博弈树的所有信息都是单结的,该博弈称为完美信息博弈,它意味着博弈中没有任何两个参与人同时行动,且所有后行动者能确切地知道前行动者选择了什么行动,所有参与人观测到自然的行动。 在博弈树上,完美信息意味着没有任何两个决策结是用虚线连起来的。 另外,扩展式表述也可用来描述静态博弈。试写出囚徒困境博弈的扩展式表述。 邢立宁 国防科技大学五院管理系 Email:xinglining04@gfkd.mtn 联系电话:0731完全信息动态博弈 (二)最优纯策略与纳什均衡 例7-1 设有两人有限零和博弈 ,其中局中人 的支付如表7-2所示。 的最大收入是8,但是如果 采取策略 ,而 采取 ,则 非但没有得到8,反而损失5。同理,如果 为得到最大收入而采取 ,则 会采取 ,而 损失3。对 来讲, 对应的最坏收入分别是 (0,-5,1),这些最坏收入中最好收入是1。同理,局中人 的各个策略 对应的最坏结果就是表7-2中每列的最大元素(3,8,4,1),其中 的最好收入是-1。 这局博弈中两个局中人最坏情况下最好的结果的绝对值相等, 分别是 和 的最优纯决策,称局势 为 的鞍点。 β1 β2 β3 β4 α1 0 2 1 0 α2 -5 8 -3 -2 α3 3 5 4 1 表7-2 支付表 假定支付为共同知识,如果甲知道乙采用策略yj,甲必然采取相应策略使自己的受益最大,即: 在甲不知道乙会采取何种策略时,如果甲是一个风险规避者,他将从收益矩阵中找出自己的每一种策略下所能获得的最小支付,即先求解 然后再这些最小收益策略中选择收益最大的策略。即 该方法的合理性是无论对方采取何种策略,甲至少可获得这个最小值中的最大值,——最小最大原理。局中人按该原则所确定的策略叫做稳妥策略。 用同样方法可导出最大最小原理。即局中人先从支付矩阵中找出其每一种策略下的最大损失,然后从这些最大损失策略中选择损失最小的策略。 假设有2个人共同拥有一个公共牧场,每个人的放牧数目为 。养羊成本为200元/只,羊的价值 。试求 。 公共地模型悲剧 假设有2个人共同拥有一个公共牧场,每个人的放牧数目为 。养羊成本为200元/只,羊的价值 。试求 (两个人依次决定)。 双寡头策略投资 主要内容 博弈的扩展式表述,多阶段可观察行动博弈,子博弈完美纳什均衡,完美信息博弈,逆向归纳法。 教学 重难点 子博弈完美纳什均衡,逆向归纳法 。 教学要求 理解子博弈完美纳什均衡, 掌握逆向 归纳法的求解过程。 引言 博弈的扩展式表达 多阶段可观察行动博弈 子博弈完美纳什均衡 完美信息博弈 逆向归纳法 举例 完全信息博弈是指每个参与人对其他参与人的策略空间及支付函数有准确认识的博弈。 动态博弈是指参与者的行动有先后,后决策者能观察到先决策者的行动,并据此选择行动。 完全信息动态博弈是指参与者对各方的策略空间及支付充分了解;参与者行动有先后顺序,后行动者在自己行动之前能观测到先行动者的行动。 1.1 引言 将百元钞拍卖给出价最高的朋友,大家互相竞价,以5元为单位,到没人加价为止。 出价最高的人只要支付所开价码即可获得这张百元钞。 出价第二高的人,虽无法获得百元钞,仍需将他所开价码如数支付。 苏必克拍卖 有一个明显的诱饵 通往诱饵之路是单向的,可进不可出 越想挣脱,就越陷越深 ”陷阱“特征 经济动机包括渴望赢得那张百元钞、想赢回他的损失、想避免更多的损失; 人际动机包括渴望挽回面子、证明自己是最好的玩家及处罚

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档