囚徒困境进化博弈求解及其现实意义..docVIP

囚徒困境进化博弈求解及其现实意义..doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
囚徒困境进化博弈求解及其现实意义.

囚徒困境进化博弈求解及其现实意义 A、B两个囚犯同时被警方抓获,然后被分开审问,A、B同属于一个犯罪团伙,于是在囚徒困境的基础上又进一步发展成了升级版综合博弈,即坦白时警方给予的较轻处罚与团伙给予的处罚之间的博弈,不坦白时警方给予的较重惩罚与团伙给予的忠诚奖励之间的博弈,从而形成了更为复杂的综合博弈。 先不妨对于警方和团伙方进行单独分析,得出以下结论: 警方: B 坦白 不坦白 A 坦白 a ,a 0 ,2a 不坦白 2a ,0 c ,c (a、c均代表一个小于0的量化惩罚系数,系数越小,代表惩罚越严重;而a<c,现实意义是,当两个囚犯都不坦白时,警方将无法对二人的及其团伙进行进一步的定罪,故而只能以较轻的惩罚代替) 犯罪团伙方 B 坦白 不坦白 A 坦白 b ,b b ,d 不坦白 d ,b d ,d (b代表一个小于0的量化惩罚系数,系数越小,则代表团伙对坦白的人实施的报复就越大,d代表一个大于0的奖励系数,即被抓捕的罪犯很好的保护了组织,组织将对其忠诚给予奖励) 综合两个博弈,得出囚徒困境进化博弈: 现实社会(d>0,且a<c,a、c、b<0) B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 使用博弈均衡分析法: 当A选择坦白时:B必须在坦白与不坦白间进行博弈,即比较a+b与2a+d的大小。三种情况: a+b>2a+d,即b-d>a,B会选择坦白。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d a+b<2a+d,即b-d<a,B会选择不坦白。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d a+b=2a+d,即b-d=a,B会犹豫不决。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 当A选择不坦白时,同样B必须在坦白与不坦白之间做出抉择,即比较b与c+d的大小。三种情况: (1)b-d>c,B会选择坦白。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d (2)b-d<c,B会选择不坦白。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d (3)b-d =c,B会犹豫不决。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 3、同理以B为“拟先手”对A的行为进行判断亦可得到上述相类似的情况。 4、综合1、2、3可得到下面四种情况即对应的行为选择分析图表: 对其中的系数关系进行进一步分析可得: (1)当a+b>2a+d,即b-d>a时,即A、B中如果一人坦白,另一人知情后一定会坦白。 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 现实情况模拟:a+b>2a+d,即b-d>a的现实意义是,犯罪分子选择坦白时受到的警方惩罚是a,并且一旦选择坦白他将彻底失去团伙内部给予忠诚分子的奖励d,并且担上了组织的惩罚b,而选择坦白的最大伤害a比放弃组织奖励d并担上组织惩罚b的伤害更大,所以当其中一名囚犯知道另一名囚犯会坦白,或者即使只是猜测,他都会义无反顾地选择坦白。 若其中一人选择不坦白或者可能选择,假设是A不坦白,则有: 1 若同时-c>d-b成立,则 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 此时只有一个帕累托最优,即(A,B)=(坦白,坦白)=(a+b,a+b)。 现实情况模拟:-c>d-b,即代表其中的一名囚犯B如果知道另一名囚犯A会选择不坦白,那囚犯B选择放弃不坦白而得到得收益(-c)比选择不坦白所得到的收益(d-b)更大,所以这时B会放弃不坦白,综上所述,如果放弃组织的奖励并担上组织的报复所受到的伤害都不如两人都不坦白受到较轻惩罚的话,那么无论另一名囚犯选择何种态度,都不影响该囚徒做出坦白的行为选择。现实建议:如果警方希望迫使这样的两个囚犯坦白,至少应该使他们即使都不坦白受到的较轻惩的伤害处程度仍大于他们担上内部惩罚并放弃忠诚奖励的伤害程度,这样警方就能轻而易举的使犯人招供,这种类型的犯人可以归类为“软弱型罪犯”,只要稍加审理即可使案件告破。 2若同时b-c<d成立,则 B 坦白 不坦白 A 坦白 a+b ,a+b b ,2a+d

文档评论(0)

sfkl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档