第八篇 博弈论.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 博弈论初步 博弈论的发展及基本概念 博弈的种类 什么是博弈论? 古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。 数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法… 一个著名的例子:囚徒困境 第一节:博弈论的发展及基本概念 一、概念: 博弈论:又称对策论,是一种分析战略行为的方法 博弈论是描述和研究行为者之间策略相互依存和相互作用的一种决策理论。 在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选择的策略。作为博弈的结局,每个参与者都得到各自的报酬。每个参与者的报酬都是所有参与者各自所选择的策略的共同作用的结果。 第二节、博弈的种类 动态博弈 / 静态博弈 单人博弈/两人博弈/多人博弈 零和博弈/常和博弈/变和博弈 有限策略博弈/无限策略博弈 完全信息博弈/不完全信息博弈 非合作博弈 / 合作博弈 一、静态博弈 /动态博弈 静态博弈:决策选择同步进行 动态博弈:决策选择有先后次序 (一)静态博弈 囚徒困境: 两个囚徒被指控共同参与了一起犯罪活动。他们被分别关押在两个相互隔离的囚室里,并且不能通信。每个囚徒都被要求坦白所犯罪行。 对于两个囚徒而言,最好的选择是都不坦白,然而实际情况是两个囚徒决策时都以自身利益最大化为决策前提。最终两个囚徒都选择了坦白。 纳什均衡:博弈的任何一方不能够单独改变策略来提高收益的一组策略称为纳什均衡。 (二)动态博弈 博弈方的决策有先后顺序,后行动的博弈方在看到其他博弈方的决策选择后采取相应的、有针对性的行动。 动态博弈存在一定的不对称性,先行动者需深思熟虑 动态博弈扩展形 二、单人博弈/两人博弈/多人博弈 单人博弈:只有一个博弈方,一个博弈方面对一定局面如何决策的问题。个体最优化问题 投资证卷的期望收益: 两人博弈:两个各自独立决策,相互具有策略依存关系的博弈方之间的博弈。最常见,最普通。 特点: 两个博弈方利益可对抗,可不对抗 掌握信息多不一定得益多 个人追求利益最大化往往不能使社会利益最大化 多人博弈:三个或三个以上的博弈方参加。 特点: 与两人博弈类似 可能存在破坏者 三、零和博弈/常和博弈/变和博弈 零和博弈:各博弈方得益之和总为零。 “你死我活” Eg:剪刀石头布,打官司,竞选,竞标 常和博弈:各博弈方得益之和为非零常数。 “你多我少” Eg:多人分食某物,某单位确定分配方案。 变和博弈:博弈方的得益总和可大可小,可以变化。 博弈方的得益之和大小取决于博弈方采取的策略组合。如囚徒困境。 四、有限策略博弈/无限策略博弈 有限策略博弈:可供博弈方选择的策略数量有限。 无限策略博弈:可供博弈方选择的策略数量无限。 五、完全信息博弈/不完全信息博弈 完全信息博弈:各博弈方都完全了解所有博弈方各种情况下得益。 囚徒困境 不完全信息博弈:至少存在部分博弈方不完全了解其他博弈方的得益。 竞标,打牌 六、合作博弈/非合作博弈 合作博弈:各博弈方能达成某种有约束力的协议,以使他们选择共同的或联合的策略,从而实现利益最大化。 非合作博弈:各博弈方不存在任何有约束力的协议,不能“串通,勾结,共谋”,只追求个人利益最大化。 “智猪博弈”(Pigs’ payoffs) 猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略? 小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩

文档评论(0)

187****5045 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档