Ch完全信息动态博弈.ppt

下载文档 降价啦

2
0
约7.42千字
约 38页
2017-08-25 发布于湖北
举报
版权申诉
保障服务

Ch完全信息动态博弈.ppt

1、本文档共38页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Ch完全信息动态博弈.ppt

清华诚志完全信息动态博弈 Dynamic Game of Complete Information 理学院顾聪 gucong@yeah.net 有一个二人参加取数的游戏，游戏分三步进行。 Step 1：参与人1在{0, 1}中取一个数记为，并告知参与人2。 Step 2：参与人2也在{0, 1}中取一个数记为，但不告知参与人1。 Step 3：又轮到参与人1取数。若参与人1在第一步中取0，则可以在{0, 1}中取一个数，若参与人1在第一步中取1，则可以在{0, 1, 2}中取一个数，记第三步参与人1取得数为。三步后取数结束。现记。若S为偶数，则参与人1赢S记分点，参与人2输S记分点。若S为奇数，则参与人1输S记分点，参与人2赢S记分点。在这个游戏中，两个参与人各自采取什么行动？若你参加，你愿意当参与人1还是参与人2 ？动态博弈有以下区别于静态博弈的特征：阶段行动与策略行动组合和策略组合支付函数信息阶段：动态博弈中，参与人是依照一定的约定规则依次进行行动。每个阶段至少有一个参与人要进行行动的，允许一个阶段中多人行动。行动与策略：动态博弈中，轮到参与人行动时，他在自己的行动集中选择一个行动。在不同的状态下和不同的阶段，参与人的行动集可能不一样。在静态博弈中，只有一个阶段，参与人的策略集与行动集是一致的。但动态博弈中策略集与行动集是不同的。支付函数：在动态博弈中，参与人的支付函数是所有行动组合到实数集的映射。如果博弈的参与人为n个人，则每个行动组合对应一个n维实数向量。信息：在动态博弈中，当每个参与人行动时，他对此前各参与人的行动组合是完全了解和知道的，称为有完美信息博弈；反之，则称为不完美信息博弈。不完美信息下，至少一个参与人在自己的行动选择时，不知道此前其他参与人采取了什么行动，自己是在什么状态下去选择自己的行动。上例中，参与人2在第二阶段行动。此时他已知道参与人1在第一阶段的选择。但参与人1在第三阶段行动时，则不知道第二阶段参与人2是选择了0还是1，但他必须行动。这时的博弈是不完美信息博弈。 2. 动态博弈均衡的可信性借债与还债问题： Step 1：参与人2向参与人1借款2万元，并承诺一年后还给局中人1连本带息共3万元。参与人1面临借款还是不借钱给参与人2。若参与人1答应借钱给参与人2，则博弈进行到第二个阶段。 Step 2：参与人2靠这笔钱共赚到4万元。他面临着到底履行诺言还是不履行诺言。若不履行诺言，则博弈进入到第三阶段。 Step 3：这时参与人1选择是将参与人2告上法庭还是不告上法庭。若告上法庭，则参与人1可以要回自己2万元，而参与人2则分文得不到。若不告上法庭，则参与人2独占4万元。这是一个完全且完美信息的动态博弈。在这个博弈中，参与人1和参与人2分别应采取什么策略呢？这三个纳什均衡的第二个((不借，上告)，不履行诺言)是不可信任的纳什均衡。因为一旦出现参与人1要上告，参与人2的行动一定是会履行诺言的。第三个纳什均衡((不借，不告)，不履行诺言)也是不可信任的纳什均衡。因为一旦出现局中人2不履行诺言，参与人1采取的行动一定是上告。只有第一个纳什均衡((借，上告)，履行诺言)是可信任的。从上例中可以看出，在动态博弈中，采用静态博弈的方法求出来的纳什均衡，并不一定是可信的。必须对其进行“精炼”，求出可信的纳什均衡。从该例可以看出，对简单的动态博弈，我们使用博弈的扩展式，可以使分析问题的思路和理解有更好的帮助。因此在本节中，我们尽可能地使用扩展式来分析一个博弈。　　　　博弈树(Game Tree)：对于博弈的扩展式描述，我们通过树形图来表示，也称博弈树。博弈树用于表述动态博弈是非常方便的，它一目了然地显示出参与人行动的先后次序，每位参与人可选择的行动，及不同行动组合下的支付水平。博弈树构成：结点(node)：决策结点(decision node)：参与人采取行动的时点。初始结点为树根；终端结点(terminal node)：博弈行动路径的终点，标注支付向量。枝(branch)：每一枝代表参与人在该时点可选择的某行动(结点与结点间的连线)。信息集(information set)：参与人每次出手时，在他现有掌握的信息基础上，所有可能选择的行动集合。扩展式博弈树的一个例子这个博弈树始于参与人1的一个决策结点，这时1要从 L和R中作出选择。如果选择L，其后就到达参与人2的一个决策结点，这时，参与人2要从L’和R’中作出选择。类似地，如果参与人1选择R，则将到达参与人2