博弈论模型总汇.pptxVIP

  • 38
  • 0
  • 约2.7千字
  • 约 25页
  • 2016-11-28 发布于湖北
  • 举报
博弈论模型 博弈论模型问题的主要特征 1、有参加竞争的对手 2、每个竞争对手都有自己可供选 择的竞争策略 3、对于每个竞争对手选定的策略, 大家都对应有一个收入 博弈论模型 纳什均衡——非合作博弈均衡 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己利益最大化。 纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡是一种非合作博弈状态。 纳什均衡——非合作博弈均衡 图中红点为鞍点,或者称为一个Nash均衡 Company Logo Diagram 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。 纳什均衡——非合作博弈均衡 智猪博弈模型 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的踏板。 踏一下踏板会有10个单位的猪食进槽但是谁按按钮就会首先付出2个单位的成本。 1、若大猪先到槽边,大小猪吃到食物 的收益比是9∶1; 2、同时到槽边,收益比是7∶3; 3、小猪先到槽边,收益比是6∶4。 智猪博弈模型 智猪博弈模型 在两头猪都有智慧的前提下,小猪该如何选择? 前提: 1、若大猪先到槽边,大小猪吃到 食物的收益比是9∶1; 2、同时到槽边,收益比是7∶3; 3、小猪先到槽边,收益比是6∶4。 智猪博弈模型 用博弈论中的报酬矩阵 可以更清晰的刻画出小猪的选择: 行动 等待 行动 5、1 4、4 等待 9、-1 0、O 小猪 大 猪 智猪博弈模型 从矩阵中可以看出, 当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待; 当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。 综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。 智猪博弈模型 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。如股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资。。。 思考:如何认识小猪“搭便车”现象? 零和博弈 零和博弈又称“零和游戏”,与非零和博 弈相对,是博弈论的一个概念,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。 “零和游戏”的基本内容:游戏者有输有赢,一方所赢正是另一方所输,游戏的总成绩永远是零。 非零和博弈 非零和博弈是一种非合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。   在这种状况时,自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。   譬如,在恋爱中一方受伤的时候,对方并不是一定得到满足。也有可能双方一起能得精神的满足。也有可能双方一起受伤。通常,彼此精神的损益不是零和的。   智猪博弈就是非零和的矩阵博弈。 囚徒困境模型 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。  若二人都互相检举(相关术语称互相“背叛”),则二人同样判监2年。 囚徒困境模型 监牢 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短? 囚徒困境模型 用表格概述如下: 甲沉默 甲认罪 乙沉默 甲0.5 乙0.5 甲0 乙10 乙认罪 甲10 乙0 甲2 乙2 囚徒困境模型 试设想困境中两名理性囚徒会如何作出选择:   若对方沉默,背叛会让我获释,所以会选择背叛。   若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 囚徒困境模型 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均

文档评论(0)

1亿VIP精品文档

相关文档