博弈论囚徒困境.pdfVIP

  • 79
  • 0
  • 约7.69千字
  • 约 36页
  • 2020-10-03 发布于陕西
  • 举报
博弈论囚徒困境 博弈(game)的要素 每个局中人的目标:最大化其赢利 每个人的赢利不仅取决于自己如何 “出招”,也取决于别人如何“出招”。 1.参与人或者局中人(players ) 2.他们可以采取的行动(actions) 或策略(strategies) 3.局中人可能得到的赢利 (payoffs)。 博弈无处不在 公路塞车,大家都遵守交规,一个人违规 进入自行车道,得便宜,但如果每人都这 样,则人人都吃亏。 如每个人都守规矩,则一个不守规矩的就 会获得好处,每个人都不守规矩,则人人 都失利。 囚徒困境的提出 • 囚徒困境是博弈论中的一种矛盾,反映 个人最佳选择并非团体最佳选择。现实中 的市场竞争、政治角逐、情场争锋等方面 会频繁出现这样的情况。1950年,由就职 于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关悖论,后来由顾问艾 伯特·塔克(Albert Tucker )以囚徒方式阐 述,并命名为“囚徒困境”。 合作(不坦白)?背叛(坦白)? 囚徒困境模型 警方逮捕甲、乙两名嫌疑犯,但没有足够证 据指控二人入罪。于是警方分开囚禁嫌疑犯, 分别和二人见面,并向双方提供以下相同的选 择: 若一人认罪并作证检控对方(相关术语称 “背叛”对方),而对方保持沉默,此人将即时 获释,沉默者将判监10年。 若二人都保持沉默(相关术语称互相“合 作”),则二人同样判监半年。 若二人都互相检举(互相“背叛”),则二 人同样判监2年。 囚徒困境赢利表(Payoff Table) 囚徒乙 合作 背叛 囚徒甲 合作 -0.5,-0.5 -10,0 背叛 0,-10 -2,-2 囚徒困境解说 • 如同博弈论的其他例证,囚徒困境假定每个 参与者(即“囚徒”)都是利己的,即都寻求最大 自身利益,而不关心另一参与者的利益。参与者 某一策略所得利益,如果在任何情况下都比其他 策略要低的话,此策略称为“严格劣势”,理性的 参与者绝不会选择。另外,没有任何其他力量干 预个人决策,参与者可完全按照自己意愿选择策 略。 囚徒困境解说 囚徒到底应该选择哪一项策略,才能将自己个 人的刑期缩至最短?两名囚徒由于隔绝监禁,并不 知道对方选择;而即使他们能交谈,还是未必能够 尽信对方不会反口。就个人的理性选择而言,检举 背叛对方所得刑期,总比沉默要来得低。试设想困 境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背 叛。 若对方背叛指控我,我也要指控对方才能得到 较低的刑期,所以也是会选择背叛。 囚徒困境解说 二人面对的情况一样,所以二人的理性思考都 会得出相同的结论——选择背叛。背叛是两种策略 之中的支配性策略。因此,这场博弈中唯一可能达 到的纳什均衡,就是双方参与者都背叛对方,结果 二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益 的帕累托最优解决方案。以全体利益而言,如果两 个参与者都合作保持沉默,两人都只会被判刑半 年,总体利益更高,结果也比两人背叛对方、判刑 2年的情况较佳。但根据以上假设,二人均为理性 的个人,且只追求自己个人利益。均衡状况会是两 个囚徒都选择背叛,结果二人判决均比合作为高, 总体利益较合作为低,这里存在着矛盾。  在对方策略确定的情况下,每个参与 者的策略都是最好的,此时没有人愿 意先改变自己的策略。 纳什均衡通俗解释 我国研究纳什均衡的专家谢识予博士在

文档评论(0)

1亿VIP精品文档

相关文档