网站大量收购独家精品文档,联系QQ:2885784924

博奕论讲稿(上海财大施锡诠)幻灯片.ppt

  1. 1、本文档共234页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 博弈论初步 及 其应用 施锡铨 触发策略和好行为 囚徒困境阶段博弈周而复始地进行,没有明确的最后阶段。 考虑如下策略对,每个局中人对应一个策略:由采用(n, n)开始。如果在任何阶段没有一个局中人认罪,那么继续采用(n, n)。但是,如果在某个阶段两个局中人中只要有一个认罪,那么从此以后每个阶段一直采用(c, c)。像这样的策略称为严厉的触发策略:对可取行动(n, n)的偏离,开启了“惩罚阶段”(c, c)。触发在下述意义下是严厉的,惩罚阶段一旦开始,决不撤消。 对于严厉触发策略,实际上只有两类子博弈——(1)在首t个阶段重复采用(n, n)之后的子博弈,和(2)其它的子博弈。 对于类型(2),策略明确说明从此以后都采用(c, c)。在这个子博弈里面,它的确是纳什均衡。没有一个局中人能在任何阶段通过取n来对付c从而增加自己的盈利;而且,他不会改变今后预期的行动方式。 对于类型(1)的子博弈,让我们检查一下局中人在任何阶段是否有认罪的动机——而其他的局中人在那个阶段取的是n。做这样的事将给认罪的局中人带来眼前的盈利7,但在以后的每一个阶段结果盈利为0。(为什么?)继续采用这个策略将为这个局中人产生当前阶段的盈利5和未来每一个时期中一连串的盈利5。因而,继续采用这个策略的总盈利为 显然,只要 ,即,只要? 大于 2/7 ,继续采用所提出的严厉触发策略较好一些。 在无限重复博弈中“好”是可以持续的,因为在每一个阶段有可能做出有条件的好人承诺——如果今天你“好”,那么明天我也“好”。(伴随的威胁是,如果今天你“恶”,那么此后我一直“恶”。)承诺保证了盈利5的持续不断;凶恶地威胁表明了从此以后盈利降为零。 如果一个局中人单方面决定今天当一回恶人,那么在他们中间,构成了将来损失5? /(1- ?)的盈利。如果很在乎未来,即,如果? 大的话,这种“大棒?胡萝卜”是十足的威慑。 严厉的触发策略由两个部分组成:第一,存在严厉的惩罚,永远地(c, c)下去。第二,存在可取的“好人”行为,永远地(n, n)。对可取行为的任何背离会触发惩罚。如果? 足够地大,那么严厉惩罚是十足的威慑以及“好人”行为是可以如愿以偿的。 严厉惩罚的威慑也可以有助于实现其他行为。 伴随不同的(和不太苛刻的)惩罚,“好人”行为也许是可实现的。 其它的惩罚 考虑下述内容:由取(n, n)开始,如果没有一个局中人认罪则继续采用(n, n);然而,如果任一个局中人在某个阶段认罪,那么在下面T个阶段采用(c, c)。此后,返回到(n, n),不过,记住以后每一次背离(n, n)也将遇到T阶段的(c, c)。像这样的策略称为宽容触发。对可取行为(n, n)的偏离触发了惩罚阶段(c, c)的开启,但是所有这些在T阶段惩罚之后得到宽容。 宽容触发是充分威慑吗?当一个局中人被认为取n时他却取了c,他得到了盈利7,然后跟着T个阶段得0,接下来——一旦行动回到(n, n)——得到5的无限序列。这样从这个“异常”行为得到的总盈利是 但是,继续采用提出的不认罪 行为产生了5的无限序列,即,终身盈利为 如果 或者等价地 那么触发是确实有效的。当折扣因子接近于1,公式的左边近似地为5(T + 1)。因此,当未来重要时——即,当? 接近于1时——即使一个周期的惩罚——即,即使T = 1——惩罚也是充分的。 定义 一个行为循环是行动的重复周期;T1个阶段采用(n, n),然后T2个阶段实施(c, c),接着T3个阶段的(n, c),然后T4个阶段的(c, n)。在这些T1 + T2 + T3 +T4个阶段结束时,又开始了循环,然后再开始。如此等等。 无名氏定理 均衡行为 考虑任何个人理性行为循环。每当折扣因子? 接近于1,那么这个循环可实现为子博弈完美均衡的行为。 均衡策略 构成均衡的一个策略是严厉触发;从可取的行为循环开始,如果两个局中人不做其它事则继续采用它。如果两者之中任何一个局中人偏离去做其它某些事情,那么此后一直采取(c, c)。 所有可能的行为都是均衡行为 在任何均衡中,每一个局中人在循环上的盈利必定至少为零。该陈述是正确的,因为每一个局中人可以使自己的盈利高于在每一阶段完全地都认罪。无名氏定理的结果指出了对于均衡来说,正盈利不仅是必要的,而且也是充分的;每一个具有正盈利的行为循环都是关于高? 值的均衡。? 考虑所有的盈利 你也许认为,只考虑循环,我们排斥了一定类型的行为。虽然是的确如此,然而这种限制并不造成损失,因为我们并没有排斥任何可能的盈利。说明一下,从盈利到行为循环的一个考虑方法是利用它的每一阶段平均盈利,。当我们察看不同的行为循环时我们得到不同的每阶段平均盈利。假如我们察看的行为不是

文档评论(0)

vqjyga55163 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档