关于分钱模型的一篇随笔.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于分钱模型的一篇随笔

关于分钱模型的一篇随笔 转载时请注明原作者:Tj.jg.h-hui 偶然在一本即将遗弃的笔记本上看到去年写了一半的分钱模型,趁闲来无事,将其补完。本来以为这只会是一个学术方面的问题,不过写着写着才发现有趣的东西越来越多,这样一个看似简单的问题也是富含着智慧和哲学。 首先将问题简化,某天,一个家伙跟A和B说:“哥有5块钱,要给你们,不过怎么分就看你们了。游戏规则是这样滴,你们每个人都告诉我你们想要的money数,如果你们想要的money之和不超过5块。就按你们的要求分了,如果超过了5块,鉴于你们的贪心,我一分都不给你们。”(这里假设他们的要求只能是整数。)我们再假设AB都是理性的,每个人的第一目标就是追求自己的最大收益。而且他们足够自私,如果自己得不到,也不让别人占便宜,当然,他们也足够聪明。 这是就博弈论中很有名的分钱模型。画出博弈方的策略收益矩阵如下所示: A 策略集 0 1 2 3 4 5 B 0 (0,0) (1,0) (2,0) (3,0) (4,0) (5,0) 1 (0,1) (1,1) (2,1) (3,1) (4,1) (0,0) 2 (0,2) (1,2) (2,2) (3,2) (0,0) (0,0) 3 (0,3) (1,3) (2,3) (0,0) (0,0) (0,0) 4 (0,4) (1,4) (0,0) (0,0) (0,0) (0,0) 5 (0,5) (0,0) (0,0) (0,0) (0,0) (0,0) 如收益矩阵所示,除去0和5这两个严格下策则该博弈有4个均衡,即(1,4),(2.3),(3,2),(4,1)。 如果是Bo1制的游戏,而且默认双方足够理性且自私,则博弈有混合策略纳什均衡,,(求解过程略。)即双方都以的概率分布随机选择1,2,3,4这四种策略。 好吧,评价一下这个策略,首先计算均衡时双方的期望收益: 。显然这个期望收益很有问题,辛辛苦苦算出来的决策的预期收益仅等于收益集中仅次于0的最低收益,换而言之只要保守地选择策略1就能保证有这样的收益,因此,从收益的角度上讲该策略是不让人满意的。但是它之所以可以达到均衡在于该策略能使对手的任何策略都无法从中占到便宜,无论对手做何决策其(期望)收益始终为1,而一旦对手偏离了该策略,自己则可以根据对方的变化做相应的改变以获取更大的收益。(当然,这只是理论可行,而且该理论目前仍有争议,不过这不是本文的重点,故这里不予讨论。)尽管收益不佳,不过在地位对称且严格不合作的博弈中这种均衡还是勉强可以接受的。 前面说了这么多只是为了引入一个理论的均衡策略,当然,如果游戏制度不为Bo1而是多回合的博弈的话,那么合作,理论上是可以进行的。尽管他们都是自私的,但是由于报复机制的存在,使得他们为了长远的利益可以暂时放弃眼前的一点蝇头小利。(现实中这可以叫做大局为重,或者有时叫放长线钓大鱼。) 好了,言归正传,写这篇文章的目的就是模拟该模型的最优决策。现提出几种备选方案(包括理性和非理性): 一类:随机决策: 方案一:采取一回合制中的混合策略均衡,即以的概率分布决策,算是精打细算型吧; 方案二:1到4的随机决策,纯属无脑乱A型; 二类:纯策略: 方案三:知足常乐型,纯策略2,咱不贪心,但你也别动了我的奶酪; 方案四:威胁型,纯策略3,哥放话就死选3了,合作你得2,不合作你得0,合不合作自己看着办; 方案五:二三二三轮流决策,一人一半,感情不散型; 三类:动态决策,即根据对方的前一轮的选择来决定自己这一轮的选择。 方案六:第一期选2,之后选对手前一轮的策略,即 ,算是礼尚往来型; 方案七:第一期选2,之后 ,算是后知后觉型; 方案八:严格报复型,二三决策,一旦对手不合作就鱼死网破,死选4; 方案九:浪子回头型,同方案八,不过一旦对方“改过自新”,就再给对方一次合作机会,重新二三决策; 方案十:死不吃亏,占便宜还不卖乖型,开始纯策略3,如果对方不合作,就开启报复机制(4),直到对方合作,回归。 好吧,暂时就这十个方案吧,下面就看他们的表演了~ 规则重述: 十个方案两两间进行单循环PK,每场比赛50个回合,在matlab下模拟其各自的得分,计入积分榜,(胜3分,平1分,负0分,积分相同者看其净胜分数和总得分。)和排行榜,评联赛冠军,即最佳方案。最后做简单评价~ matlab的源程序及运算结果在这里就不贴了。直接写整理后的结果。(鉴于随机类决策的随机性,为了使结果更为准确,在这里我取了5次比赛的平均值。)之后,比赛结果如下表所示~(单元格的数据表示行方案PK列方案后的比分。) 1。比分表: 方案 2 3 4 5 6 7 8 9 10 1 59:52 45:47 22:51 31:47 42:45 91:50 12:46 23:

文档评论(0)

xjj2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档