Ch完全信息动态博弈.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Ch完全信息动态博弈.ppt

清华诚志 完全信息动态博弈 Dynamic Game of Complete Information 理学院 顾聪 gucong@yeah.net 有一个二人参加取数的游戏,游戏分三步进行。 Step 1:参与人1在{0, 1}中取一个数记为 ,并告知参与人2。 Step 2:参与人2也在{0, 1}中取一个数记为 ,但不告知参与人1。 Step 3:又轮到参与人1取数。 若参与人1在第一步中取0,则可以在{0, 1}中取一个数, 若参与人1在第一步中取1,则可以在{0, 1, 2}中取一个数, 记第三步参与人1取得数为 。三步后取数结束。 现记 。 若S为偶数,则参与人1赢S记分点,参与人2输S记分点。 若S为奇数,则参与人1输S记分点,参与人2赢S记分点。 在这个游戏中,两个参与人各自采取什么行动? 若你参加,你愿意当参与人1还是参与人2 ? 动态博弈有以下区别于静态博弈的特征 : 阶段 行动与策略 行动组合和策略组合 支付函数 信息 阶段: 动态博弈中,参与人是依照一定的约定规则依次进行行动。 每个阶段至少有一个参与人要进行行动的,允许一个阶段中多人行动。 行动与策略: 动态博弈中,轮到参与人行动时,他在自己的行动集中选择一个行动。在不同的状态下和不同的阶段,参与人的行动集可能不一样。 在静态博弈中,只有一个阶段,参与人的策略集与行动集是一致的。但动态博弈中策略集与行动集是不同的。 支付函数: 在动态博弈中,参与人的支付函数是所有行动组合到实数集的映射。如果博弈的参与人为n个人,则每个行动组合对应一个n维实数向量。 信息: 在动态博弈中,当每个参与人行动时,他对此前各参与人的行动组合是完全了解和知道的,称为有完美信息博弈;反之,则称为不完美信息博弈。 不完美信息下,至少一个参与人在自己的行动选择时,不知道此前其他参与人采取了什么行动,自己是在什么状态下去选择自己的行动。 上例中,参与人2在第二阶段行动。此时他已知道参与人1在第一阶段的选择。但参与人1在第三阶段行动时,则不知道第二阶段参与人2是选择了0还是1,但他必须行动。这时的博弈是不完美信息博弈。 2. 动态博弈均衡的可信性 借债与还债问题: Step 1:参与人2向参与人1借款2万元,并承诺一年后还给局中人1连本带息共3万元。参与人1面临借款还是不借钱给参与人2。若参与人1答应借钱给参与人2,则博弈进行到第二个阶段。 Step 2:参与人2靠这笔钱共赚到4万元。他面临着到底履行诺言还是不履行诺言。若不履行诺言,则博弈进入到第三阶段。 Step 3:这时参与人1选择是将参与人2告上法庭还是不告上法庭。若告上法庭,则参与人1可以要回自己2万元,而参与人2则分文得不到。若不告上法庭,则参与人2独占4万元。 这是一个完全且完美信息的动态博弈。 在这个博弈中,参与人1和参与人2分别应采取什么策略呢? 这三个纳什均衡的第二个((不借,上告),不履行诺言)是不可信任的纳什均衡。因为一旦出现参与人1要上告,参与人2的行动一定是会履行诺言的。 第三个纳什均衡((不借,不告),不履行诺言)也是不可信任的纳什均衡。因为一旦出现局中人2不履行诺言,参与人1采取的行动一定是上告。 只有第一个纳什均衡((借,上告),履行诺言)是可信任的。 从上例中可以看出,在动态博弈中,采用静态博弈的方法求出来的纳什均衡,并不一定是可信的。必须对其进行“精炼”,求出可信的纳什均衡。 从该例可以看出,对简单的动态博弈,我们使用博弈的扩展式,可以使分析问题的思路和理解有更好的帮助。因此在本节中,我们尽可能地使用扩展式来分析一个博弈。     博弈树(Game Tree): 对于博弈的扩展式描述,我们通过树形图来表示,也称博弈树。 博弈树用于表述动态博弈是非常方便的,它一目了然地显示出参与人行动的先后次序,每位参与人可选择的行动,及不同行动组合下的支付水平。 博弈树构成: 结点(node): 决策结点(decision node):参与人采取行动的时点。初始结点为树根; 终端结点(terminal node):博弈行动路径的终点,标注支付向量。 枝(branch): 每一枝代表参与人在该时点可选择的某行动(结点与结点间的连线)。 信息集(information set): 参与人每次出手时,在他现有掌握的信息基础上,所有可能选择的行动集合。 扩展式博弈树的一个例子 这个博弈树始于参与人1的 一个决策结点,这时1要从 L和R中作出选择。 如果选择L,其后就到达 参与人2的一个决策结点, 这时,参与人2要从L’和R’中 作出选择。 类似地,如果参与人1选择R, 则将到达参与人2

文档评论(0)

基本资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档