博弈论与组合优化中的Nash均衡的精化与粗化I吴焦苏清华大学上海教学.ppt

博弈论与组合优化中的Nash均衡的精化与粗化I吴焦苏清华大学上海教学.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论与组合优化中的Nash均衡的精化与粗化I吴焦苏清华大学上海教学

博弈论与组合优化中的 对偶问题 吴焦苏 清华大学上海教学中心 华东师范大学数学系 上海建桥学院 上海 2005.8 博弈论的四个 研究纲领 1.1. 博弈论发展过程中的四个 研究纲领 von Neumann纲领 1928 Nash纲领1950 Aumann纲领1974 重复博弈中的有限自动机博弈理论、 复杂性理论和学习理论 1993 1.1 博弈论发展过程中的四个 研究纲领 1.2 博弈论研究纲领与组合优化之间 的对应关系 1.3 二人零和有限博弈与线性规划 对偶之间的对应关系 von Neumann提出二人零和博弈的对偶思想——这种对偶思想由线性规划的原始-对偶算法来表示 Dantzig(1951)、Gale、Kuhn和Tucker(1951)证明混合策略Nash均衡与线性规划的对偶存在着等价关系。 1.4 二人非零和有限博弈与非线性规 划对偶之间的对应关系 Binmore 较早地认识到,Nash纲领隐含了一种对偶算法,但是这种对偶算法不象二人零和博弈那么明显、直观 Rubinstein(1982)定理:在无限期轮流出价博弈中,唯一的子博弈完美Nash均衡是: ,如果δ1=δ2=δ, δ1=δ2=1时,该博弈有无穷多个子博弈完美均衡,x*=1/2可能是一个聚点均衡,这个聚点均衡是Nash讨价还价解 1.4 二人非零和有限博弈与非线性规 划对偶之间的对应关系 Nash 讨价还价解E s.t. 四个公理: 测度的无关性(invariance) Pareto有效性(efficiency) 无关选择的独立性(independence of irrelevant alternatives) 对称性(symmetry) 1.5 二人一般博弈与非线性规划对偶 之间的对应关系 Aumann纲领的对偶算法比二人零和博弈及二人非零和博弈更不严格、明显、直观 但Aumann纲领将Nash纲领中隐含的对偶算法进一步明确表述出来,称其为均衡精化和均衡粗化 使我们能够非常明确的意识到 n人博弈的Nash均衡也应当有一种对偶算法 1.5 二人一般博弈与非线性规划对偶 之间的对应关系 Aumann用一种统一的分析方法将重复博弈当作一般讨价还价过程的二人一般博弈的一种范式 出于沟通、传递信息等目的,行为人之间的长期互动行为,可以使用单个的一次性行动,这类行动对总支付的影响可以忽略不计 这样Aumann使用一个简单的标准讨价还价模型将行为人与其他人外生地讨论的沟通、交流等行为内生化,从而以一种简练、明确、优雅的方法初步解决了重复博弈中信息的复杂性问题 1.5 二人一般博弈与非线性规划对偶 之间的对应关系 从Nash纲领到Aumann纲领的转向得到了很多博弈论学者的支持: 首先是Selten、Harsanyi等人在Aumann纲领正式提出前对均衡精化的研究 其次是Hart和Schmeidler、Nau和McCardle、Myerson、Fudenberg和Levine、Foster和Vohra、Hart和Mas-Colell等人在Aumann纲领正式提出后对均衡粗化具体内容的研究 1.5 二人一般博弈与非线性规划对偶 之间的对应关系 Hart和Mas-Colell(2000,2001a,2001b,2003a,2003b): 耦合动态(Coupled Dynamic)收敛到Nash均衡 非耦合动态(Uncoupled Dynamic)收敛到相关均衡 所谓耦合动态是指每个行为人的动态依赖于其他行为人的支付函数 非耦合动态是指每个行为人的动态不依赖于其他行为人的支付函数 1.5 二人一般博弈与非线性规划对偶 之间的对应关系 非耦合动态包括: 对被校准预测的最优反应(Best-reply to Calibrated Forecasts, Foster和Vohra1997,1998,1999; Foster1999) 特征向量条件平滑虚拟行动 (Eigenvector-conditional-smooth-fictitious-play, Fudenberg和Levine,1995,1999a,1999b), 条件后悔匹配(Conditional-regret -matching, Hart和Mas-Colell2000,2001)等三种算法 这三种算法都收敛到相关均衡。 1.5 二人一般博弈与非线性规划对偶 之间的对应关系 Ha

文档评论(0)

shujukd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档