经典博弈论完整版培训课程1.pptx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

经典博弈论培训课程

目录博弈论概述一博弈论模型二博弈论应用三博弈论成果四

策有以下几种基本要素:博弈论概念:博弈即一些个人,队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各允许选择的行为或策略中进行选择并加以实施,各自取得相应的结果的过程。一.局中人(players):在策略型博弈中,一个对即博弈的参与者,他们是博弈的决策主体行为。根据自己的利益要求决定自己的,记局中人为i,局中人集合为{1,2,…,i},即共有i个局中人。我们将某个局中人以外的其它局中人称为“i的对手”,记为-i。二.策略(strategies) :即指每个局中人在对策中可以选择采用的行动方案,但这个方案必须是一个完整的行动,而不是行动的某一步。每个局中人均有可供选择的多种策略。三.支付或收益(payoffs):是指一局博弈的得失。或者说是局中人从各种策略组合中获得的效用,它是策略组合的函数。如果局中人得失的总和为零,则称这种对策为零和对策;否则,称为非零和博弈。博弈论概述

博弈论历史变exthere05我国古T代ex围th棋ere国际象棋(印度)等、 。Copypastefonts.Choosetheonlyoptiontoretaintext.第一次、第二次世界大战,军事对策应用于战役和战略研究。Copypastefonts.Choosetheonlyoptiontoretaintext.1912年,数学家翟墨罗把对策从模拟模型抽象为数学模型。1944年,冯·诺意曼、摩根斯特合写了“博博弈弈论论和和经经济济行行为为”,推动了博弈C论op在yp经as济t济te管f管fon理t理ts.中Ch的h的oo应se用the。onlyoptiontoretaintext.近年来,由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖(1994),进一步推动了博弈论的研究。

博弈论现代应用案例美丽心灵美丽心灵(ABeautifulMind)是一部改编自同名传记而获得奥斯卡金像奖的电影。影片讲述一位患有精神分裂症但却在博弈论和微分几何学领域潜心研究以致获得诺贝尔经济学奖的数学家约翰·福布斯·纳什。

博弈论常见经典模型TexthereChoosetheonlyoptiontoretaintextexthere囚徒困境TexthereCopyp纳aste什fon均ts.衡Choosetheonlyoptiontoretaintext.Copypa性ste别fon战ts.Texthere优C优Cop超ypa解stefonts.Choosetheonlyoptiontoretaintext.

目录博弈论概述一博弈论模型二博弈论应用三博弈论成果四

博弈论模型—囚徒困境(prisoner’sdilemma)囚徒B坦白抵赖坦白-8,-80,-15抵赖-15,0-1,-1囚徒A这个例子可以看作是非合作博弈现象的一个抽象概括。它讲的是两个嫌疑犯被隔离审讯。他们面临的处境是:如果两人都坦白,各判刑8年;如果两人都抵赖,各判刑1年(或许证据不足);如果一人坦白另一人抵赖,则坦白的放出去,不坦白的判刑15年,(“坦白从宽、抗拒从严”)。这里,两个囚徒就是两个局中人,每个局中人都有两个策略可T供e供ex选t择h:er坦e白或抵赖。表中每一格的一对数字分别表示局中人不同策略组合的收益,第一个数字是囚徒A的收益,第二个数字是囚徒B的收益。这种有限对策(局中人是有限个,每个局中人的策略数也是有限的)往往用矩阵形式表示。在对博弈局势进行描述后,博弈论分析就是要求出局中人进行策略选择的理性结局,或者说找出博弈问题的解。在非合作博弈中,有两种解的技术:一种是纳什均衡,一种是优超解。

博弈论模型—纳什均衡解析:在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-15,显然“坦白”为好;同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。纳什均衡类型选择一选择二选择三选择四囚徒A坦白(8)抵赖(15)坦白(0)抵赖(1)囚徒B坦白(8)坦白(0)抵

文档评论(0)

159****1944 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档