囚徒困境进化博弈求解及其现实意义.docVIP

下载本文档

11
0
约3.6千字
约 6页
2017-08-07 发布于重庆
举报
版权申诉

囚徒困境进化博弈求解及其现实意义.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

囚徒困境进化博弈求解及其现实意义.doc

囚徒困境进化博弈求解及其现实意义 A、B两个囚犯同时被抓，然后被分开审问，A、B同属于一个犯罪团伙，于是在囚徒困境的基础上又进一步发展了升级综合博弈，即坦白时警方的与团伙的处罚之间的博弈，不坦白时警方的惩罚与团伙的之间的博弈，从而形成了更为复杂的综合博弈。警方： B 坦白不坦白 A 坦白 a ,a 0 ,2a 不坦白 2a ,0 c ,c (a、c均代表一个小于0的量化惩罚系数，系数越小，代表惩罚越严重；而a＜c，现实意义是，当两个囚犯都不坦白时，警方将无法对二人的及其团伙进行进一步的定罪，故而只能以较轻的惩罚代替) 犯罪团伙方 B 坦白不坦白 A 坦白 b ,b b ,d 不坦白 d ,b d ,d (b代表一个小于0的量化惩罚系数，系数越小，则代表团伙对坦白的人实施的报复就越大，d代表一个大于0的奖励系数，即被抓捕的罪犯很好的保护了组织，组织将对其忠诚给予奖励) 综合两个博弈，得出囚徒困境进化博弈：现实社会(d＞0，且a＜c，a、c、b＜0) B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 使用博弈均衡分析法：当A选择坦白时：B必须在坦白与不坦白间进行博弈，即比较a+b与2a+d的大小。三种情况： a+b＞2a+d，即b-d＞a，B会选择坦白。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d a+b＜2a+d，即b-d＜a，B会选择不坦白。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d a+b=2a+d，即b-d=a，B会犹豫不决。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 当A选择不坦白时，同样B必须在坦白与不坦白之间做出抉择，即比较b与c+d的大小。三种情况：（1）b-d＞c，B会选择坦白。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d （2）b-d＜c，B会选择不坦白。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d （3）b-d =c，B会犹豫不决。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 3、同理以B为“拟先手”对A的行为进行判断亦可得到上述相类似的情况。 4、综合1、2、3可得到下面四种情况即对应的行为选择分析图表：对其中的系数关系进行进一步分析可得：（1）当a+b＞2a+d，即b-d＞a时，即A、B中如果一人坦白，另一人知情后一定会坦白。 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 现实情况模拟：a+b＞2a+d，即b-d＞a的现实意义是，犯罪分子选择坦白时受到的警方惩罚是a,并且一旦选择坦白他将彻底失去团伙内部给予忠诚分子的奖励d，并且担上了组织的惩罚b，而选择坦白的最大伤害a比放弃组织奖励d并担上组织惩罚b的伤害更大，所以当其中一名囚犯知道另一名囚犯会坦白，或者即使只是猜测，他都会义无反顾地选择坦白。若其中一人选择不坦白或者可能选择，假设是A不坦白，则有： 1 若同时-c＞d-b成立，则 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 此时只有一个帕累托最优，即（A,B））现实情况模拟：-c＞d-b，即代表其中的一名囚犯B如果知道另一名囚犯A会选择不坦白，那囚犯B选择放弃不坦白而得到得收益（-c） 2若同时b-c＜d成立，则 B 坦白不坦白 A 坦白 a+b ,a+b b ,2a+d 不坦白 2a+d ,b c+d ,c+d 此时就拥有了两个帕累托最优，（A,B））））现实情况模拟：由1可知，如果犯人放弃组织忠诚奖励并担上组织惩罚所受到伤害介于两个囚犯都坦白所受到的惩罚伤害与两个囚犯都不坦白所受到的惩罚伤害之间的话，那么囚犯完全可能会在坦白与不坦白间徘徊不定，甚至可能由于先前的协约，而导致警方的审讯很难达到预期效果。现实建议：此时的囚犯容易在坦白与不坦白间徘徊，对于他们而言似乎只有唯一确定另一名囚犯坦白了或者不坦白，他们才会做出选择，这时警方可以适当的诱之以利害，于是此处有给警方提出了一个新的要求，即对认罪态度好，积极配合警方办案的罪犯在给予惩罚上的宽大措施以外，还要对