- 1、本文档共81页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论方法
经济博弈论方法第四部分;第六章 完全信息静态博弈;;;策略故事;引言;数学界的梵高——“疯子天才”纳什 ?;三位大师主要的贡献;Selten and Harsanyi;诺贝尔经济学奖;从游戏到博弈;什么是博弈论?;博弈三要素;博弈的关键;博弈的四种分类情况;博弈的分类及对应的均衡;纳什均衡;纳什均衡的定义; 我们常用G表示一个博弈; 如G有n个博弈方,每个博弈方的全部可选策略的集合我们称策略空间,分别用 表示; 用 表示博弈方i的第j个策略,其中j可取有限个值(有限策略博弈),也可取无限个值(无限策略博弈);博弈方i的得益则用 表示, 是各博弈方策略的多元函数。n个博弈方的博弈G常写成
;定义;纳什均衡的一致预测性;纳什均衡应用;囚徒2
囚徒1;囚徒困境说明了什么;囚徒困境的意义;双寡头削价竞争;对经典经济学的冲击;从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。
;研究囚徒困境问题的目的;混合策略纳什均衡; 许多现实中决策问题构成的博弈中根本不存在具有稳定性的各博弈方都接受的纳什均衡策略组合如猜硬币博弈和齐威王田忌赛马,而另一些博弈却有多于一个的纳什均衡策略组合,如夫妻之争博弈。这两类博弈如果只进行一次,实际结果如何确实取决于机会和运气,如果多次独立反复进行这些博弈,这样博弈方决策的好坏就会从平均得益上反映出来,策略运用得当平均收益会较理想,至少是不吃亏,否则平均得益就会很差。
;概念的引进; 在这种博弈中各博弈方决策的第一个原则:自己的策略选择千万不能预先被另一方侦知或猜到。
这就是说博弈方必须随机地选择策略。
其次,在本博弈中,如果盖硬币方虽然是随机决定出正面还是反面,但如果在总体上出正面多于出反面,即出正面的概率大于出反面的概率,则猜硬币方还是有机可乘。; 设盖硬币方出正面的概率为p,则出反面的概率为1-p.出正面多于出反面,即p>1-p或p>1/2。在这种情况下,如猜硬币方全猜正面,则他的期望得益:
即平均来讲,猜硬币方一定是赢多输少。;;定义; 相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略”,而我们原来意义上的纳什均衡,即任何博弈方都不愿单独改变策略的纯策略组成的策略组合现在可称为“纯策略纳什均衡”。当然,纯策略也可以看作混合策略的特例。 ;; 引进了混合策略的概念以后,我们可将纳什均衡的概念扩大到包括混合策略的情况。对各博弈方的一个策略组合,不管它是纯策略组成的还是混合策略组成的,只要满足各博弈方都不会想要单独偏离它,我们就称之为一个纳什均衡。如果确实是一个严格意义上的混合策略组合构成的纳什均衡,称为“混合策略纳什均衡”。 ; 猜硬币博弈中两博弈方都以(1/2,1/2)的概率分布随机选择正面和反面的混合策略组合,就是一个混合策略纳什均衡。
期望得益:
零和博弈!
;应用例子;; 设博弈方1选A的概率为pA,选B的概率为pB,博弃方2选C的概率为pC,选D的概率为pD。根据上述第二个原则,博弈方1选A和B的概率,一定要使博弈方2选C的期望得益和选D的期望得益相等,即:
这是博弈方1的混合策略。 ; 同理,博弈方2的混合策略为
博弈方1以(0.8,0.2)的概率随机选择A和B,博弈方2以(0.8,0.2)的概率随机选择C和D,由于这时谁都无法通过改变自己的混合策略(概率 分布)而改善自己的得益(期望得益)、因此这样的混合策略组合是稳定的,是一个混合策略纳什均衡。; 该混合策略纳什均衡的期望结果(即双方的期望得益)分别为:
;;;第七章 完全信息动态博弈;动态博弈的表示法和特点;阶段;扩展形表示法;动态博弈的基本特点;;可信性问题;开金矿博弈;乙如何决策呢?;增加对甲的约束;法律保障不足的开金矿博弈;结论;打击的威胁是可信的;打击的威胁是不可信的;子博弈完美纳什均衡;动态博弈中的子博弈;归篷汾撬了御烬慰难淡采对琢啄绑抽痴晚章痔钻捣枉壕苔敞渠捻叁翌炔林博弈论的方法博弈论的方法;子博弈定义;递推归纳法;博弈方2选择打击,博弈方选择不进;应用;伎埠镑锁槽钡季昌逮橙慑肥秘捂笺心畴蠕砍瞳服欲辟蔚娱撅嘎控第仙碟衫博弈论的方法博弈论的方法;;子博弈完美纳什均衡;;塞尔顿(selten)1965年给出了子博弈完美纳什均衡的定义:; “子博弈完美纳什均衡”是分析动态博弈,或者说完全且完美信息动态博弈的关键概念。而逆推归纳法正是(至少在完美信息动态博弈范围之内)寻找动态???弈的子博弈完美纳什均衡的基本方法。
文档评论(0)