博弈论囚徒困境.pdfVIP

下载本文档

79
0
约7.69千字
约 36页
2020-10-03 发布于陕西
举报

博弈论囚徒困境.pdf

博弈论囚徒困境博弈(game)的要素每个局中人的目标：最大化其赢利每个人的赢利不仅取决于自己如何 “出招”，也取决于别人如何“出招”。 1.参与人或者局中人(players ) 2.他们可以采取的行动(actions) 或策略(strategies) ３.局中人可能得到的赢利（payoffs）。博弈无处不在公路塞车，大家都遵守交规，一个人违规进入自行车道，得便宜，但如果每人都这样，则人人都吃亏。如每个人都守规矩，则一个不守规矩的就会获得好处，每个人都不守规矩，则人人都失利。囚徒困境的提出 • 囚徒困境是博弈论中的一种矛盾，反映个人最佳选择并非团体最佳选择。现实中的市场竞争、政治角逐、情场争锋等方面会频繁出现这样的情况。1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关悖论，后来由顾问艾伯特·塔克（Albert Tucker ）以囚徒方式阐述，并命名为“囚徒困境”。合作（不坦白）?背叛（坦白）? 囚徒困境模型警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检控对方（相关术语称 “背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。若二人都互相检举（互相“背叛”），则二人同样判监2年。囚徒困境赢利表（Payoff Table) 囚徒乙合作背叛囚徒甲合作－0.5，－0.5 －10，0 背叛 0，－10 －2，－2 囚徒困境解说 • 如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒困境解说囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。囚徒困境解说二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑 2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低，这里存在着矛盾。  在对方策略确定的情况下，每个参与者的策略都是最好的，此时没有人愿意先改变自己的策略。纳什均衡通俗解释我国研究纳什均衡的专家谢识予博士在

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

博弈论囚徒困境.pdfVIP