2014博弈论第一章3答题.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 1·3 理论发展:混合战略和均衡的存在性 1·3·A 混合战略 纳什均衡不存在的例子 “猜硬币”博弈不存在纳什均衡. 每个参与者都 -1 , 1 1 ,-1 反面 正面 反面 正面 1 ,-1 -1 ,1 在博弈中, 猜硬币博弈一个非常突出的特点是 一旦每个参与者 (至少不存在第 1·1·C 节所定义的所定义的纳什均衡), 试图能先猜中对方的战略. 都竭力猜测其他参与者的战略选择, 就不存在纳什均衡 不确定的, 一个参与者对其他参与者行 为的不确定性. 规范的表述,参与者i 的一个混合战略是在其战略 空间Si 上的一些或全部战略的 中的战略为参与者i 的纯战略. 因为这时参与者的最优行为是 而博弈的结 混合战略可以解释为 以后我们称Si 果必然包含这种不确定性. 概率分布. 一个参与者 对完全信息静态同时行动博弈来说, 的纯战略就是他可以选择的不同行动. 例如, 在猜硬币 博弈中Si 内含有两个纯战略, 分别为正面和反面,这时 参与者i 的一个混合战略为概率分布 出现正面的概率, 1-q为出现反面的概率,而且 其中q为 另外,混合战略也可以表示纯战略, 例如, 一般地,假设参与者i有K个纯战略: 则参与者i 的一个混合战略是一个概率分布 表示对所有 混合战略 (1, 0) 表示参与者的一个纯战略,即选择正 而混合战略 表示以概率1/3选择正面,以 概率2/3选择反面. pi 表示基于Si 的任意一个混合战略组合, 其中包含了参 面. 其中 参与者i 选择战略sik的概 率,且 我们用 与者选择的每一个纯战略. 正如我们用si 表示Si 内任意 一个纯战略. 定义 那么参与者i 的一个混合战略为概率分 其中对所有 对标准式博弈 假设 布 且 混合战略的一个应用 前面讲到,如果战略si 为严格劣战略,那么参与者 i 的最优反应战略不会是 如果引入混合战略,就可 以证明其逆命题: 与者i 都不可能作出这样的推断,即其战略 会成为最 如果(针对其他参与者的战略选择)参 优反应战略,则一定存在另一个战略严格优于 1,— 1,— 3,— 0,— 0,— 3,— 参与者1 图 1.3.1 参与者2 图1.3.1显示出,一个给定的纯战略可能会严格劣 于一个混合战略, 即使这个纯战略并不严格劣于其他 任何一个纯战略. 对于参与者2的任何一个混合战略 参与 参与者1的最优反应要么是T,要么是M, 但不会 者2选择L的概率为 选择R 的概率为 . 可以断言: 是B. 容易得出当 时, 参与者1选择T ;当 时,参与者1选择M . 选择T,M无差异. 由此说明T 和M 的混合战略 严格优于纯战略 注意: 此时参与者关心的是期望收益. 参与者1选 择T 的期望收益为 选择M 的期望收益为 B. 2,— 2,— 3,— 0,— 0,— 3,— 参与者1 图 1.3.2 参与者2 类似于对图 1.3.1的分析,对图 1.3.2分析可以得出 一个给定的纯战略可能会严格优于一个混合战略, 这个纯战略并不严格劣于其他任何一个纯战略. 1·3·B 纳什均衡的存在性 纯战略情况下,参与者i 的收益ui 是纯战略组合的函 参与者混合战略的使用, 有不确定性, 使得参与者的战略选择带 因此参与者的收益必然也不确定. 即使 数, 参与者i 的收益ui 是混合战略 混合战略情况下, 组合的函数, 也就是纯战略情况下期望收益. 假设博弈是有限的. 参与者i 在纯战略组合 下的收益函数为ui ,即 其中 是参与者j 的纯战略, 参与者i 在混合战略情况下的期望收益用 表示. 其中 表示 混合战略组合, 是参与者k 的混合战略, 表示除i 之外的混合战略组 参与者i 期望收益可以定义为: 合, 其中 S 表示参与者i 的纯战略组合空 间, 是参与者j 选择纯战略 的概率. 定义:在n个参与者博弈的战略式表述 中,混和战略组合 是一个纳什均 如果对于所有的i =1, 2, …, n ,下式 成立. 表示参与者i 的混合战略空间. 衡. 等价地, 是下列最优化问题的解 对于所有的i =1, 2, …, n 以及所有的 都成立. 两个参与者博弈混合战略下的纳什均衡. 假设参与者1和2的战略空间分别为 如果参与者1推断参与者2将以 和 用 分别表示 中的任意

文档评论(0)

希望之星 + 关注
实名认证
文档贡献者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档