- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1完全信息静态博弈1完全信息静态博弈
1 完全信息静态博弈
1.0 博弈论(对策论)的概念和分类
1.0.1博弈论(对策论):研究在利益相互影响的态势下,理性的参与人为实现自己的利益最大化,如何选择各自的策略,以及这种策略的均衡问题。或,当某个参与人的选择受其他参与人选择的影响,而且反过来又影响到其他参与人选择时的决策问题和相应的均衡问题。
博弈论与最优化理论
1.0.2博弈的类型
(1)参与者行动的时间与顺序
同时行动——静态博弈;
先后行动——动态博弈。
(2)参与者的信息多少
知道对手的特征、策略空间、支付函数等——完全信息博弈;
不知道对手的特征、策略空间、支付函数等——不完全信息博弈。
将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。
(3)参与人之间是否存在具有约束力的协议
有——合作博弈
无——非合作博弈
(4)参与人各方的得益总和是常数还是变数。
常数——常和博弈
变数——变和博弈
1.1 基本理论: 博弈的标准式和纳什均衡
1.1.1博弈模型的基本构成
(1) 参与人 ( player):博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)
n 个参与人:1, 2, …, i, …, n ((.
自然(N)是虚拟的参与人,决定随机变量的概率分布
(2) 战略 (strategy):参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排
完全信息静态博弈中,一个参与人的战略是他采取的一个行动(action)
参与人 i 的战略:si.
参与人 i 的战略空间: Si.
战略的一个组合: s ={s1,s2, …, sn}.
简化表示:s- i={ s1,…, s i -1, s i+1, …, sn }.
(3) 收益 (payoff):参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数
参与人 i 的收益:ui= ui(s1,s2, …, sn)
(4)信息(information):指参与人在博弈中拥有的相关知识,特别是有关其他参与人的策略和收益的知识
完全信息 (complete information):每个参与人知道其他人的特征、战略空间和收益
共同知识(common knowledge)指“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道…”。
(5)均衡(equilibrium):所有参与人的最优策略或行动的组合
均衡与均衡结果是两个容易混淆的概念,均衡结果是策略组合产生的结果。
n 个参与人博弈的标准形式表示:
G = {S1, S2, …, Sn;u1, u2, … , un}
静态博弈 (static game):所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1 博弈 {石头、剪刀、布} 的描述:
参与人:1,2。
战略空间:{石头、剪刀、布}
收益:两人战略的函数
u1 (石头,石头) = 0, u1 (石头,剪刀) = 1, u1 (石头,布) = -1
…
u2 (石头,石头) = 0, u2 (石头,剪刀) = -1,u2 (石头,布) = 1
……
收益表:两个参与人,有限个战略的博弈的表示方法。
P2
石头 剪刀 布
石头 0 , 0 1 , -1 -1 ,1
P1 剪刀 -1 , 1 0 , 0 1 ,-1
布 1 ,-1 -1 , 1 0 ,0
博弈的问题:能否知道每个参与人选择的战略?
当参与人的个数为有限数且每个参与人的战略空间中的元素只有限个时,称博弈为有限博弈(finite game)。
例2: 囚徒困境 (The Prisoner’s Dilemma)
囚徒 2
不坦白 坦白
不坦白 -1 ,-1 -9 ,0
囚徒 1
坦白 0 ,-9 -6 ,-6
囚徒1的考虑:无论对方选不坦白还是坦白,自己选“坦白”好于“不坦白”。
囚徒2的考虑: 无论对方选什么,“坦白”好于“不坦白”。
两人的选择: (坦白,坦白)。
1.1.2纳什均衡
(1)占优战略均衡(dominant-strategy equilibrium),是指当所有参与人都选择各自的严格占优战略时所出现的战略组合
定义:
则称为参与人i的严格占优
原创力文档


文档评论(0)