基于有限次重复博弈足球点球策略分析.docVIP

下载本文档

8
0
约2.37千字
约 6页
2018-10-30 发布于福建
举报
版权申诉

基于有限次重复博弈足球点球策略分析.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于有限次重复博弈足球点球策略分析

基于有限次重复博弈足球点球策略分析　　摘要：博弈论是具有斗争或竞争性质现象的数学理论和方法，足球在罚点球过程中常常要分析对方做出的策略，然后做出有利于自己的策略，这样才可以提高罚点球成功的概率。　　关键词：博弈论；策略；概率　　1 零和博弈　　零和博弈又称“零和游戏”，是博弈论的一个概念，属于非合作博弈，指参与博弈的各方，在严格竞争下，一方的收益必然意味着另一方的损失，博弈各方的收益和损失相加总和永远是“零”。双方不存在合作的可能。也可以说：自己的幸福是建立在他人的痛苦之上的，二者的大小完全相等，因而双方都“损人利己”。零和博弈的结果是一方吃掉另一方，一方的所得正是另一方的所失，整个社会的利益并不会因此而增加一分。　　2 基于零和博弈下的足球罚点球　　参与人A主罚点球，B参与人防守。A参与人可以踢向球门的左方，也可以踢向球门的右方；B参与人可能偏好球门的某一方，从而扑向球门的左方或球门的右方，以拦截来球。　　我们用预期的百分点数来表示这些策略产生的收益。很显然，如果B参与人扑错了方向，A参与人得分的可能性就较大一些。另一方面，这个博弈并非完全对陈，这是因为，A参与人可能善于朝某个方向踢；同样，B参与人可能善于按某个方向防守。　　我们假定，如果A参与人踢向球门的左方，那么，当B参与人扑向右方时，A参与人将在80%的时间内得分，当B参与人扑向左方时，A参与人将在50%的时间内得分；如果A参与人踢向球门的右方，那么，当B参与人扑向左方时，A参与人将在90%的时间内得分，当B参与人扑向右方时，A参与人将在20%的时间内得分。这些收益矩阵如表1所示。　　如表1所示，每一方格中的总收益为零，这显示参与人踢球的方向，他就拥有极大的优势。意识到这一点，A参与人会竭力使得B参与人猜不透自己的意图。具体地，他有时会踢向他擅长的一方，有时会踢向他不擅长的一方。这就是说，他采取的是一种混合策略。　　如果A参与人选择踢向左方的概率是p，那么，当B参与人扑向左方时，A参与人的期望收益为50p+90（1-p）；当B参与人扑向右方时，A参与人的期望收益为80p+20（1-p）。A参与人想使这个期望收益尽可能的大，而同时，B参与人却想使这个期望收益尽可能的小。举例来说，假定A参与人选择踢向左方的概率是50%，当B参与人扑向左方时，A参与人的期望收益为50×1/2+90×1/2=70；当B参与人扑向右方时，A参与人的期望收益为80×1/2+20×1/2=50。　　A参与人意识到，B参与人总是在试图最小化他的期望收益。因此，对于任意的p，他有期望获得的最佳收益是上述两个策略所给出的收益中的最小值。我们可以得出50p+90（1-p）= 80p+20（1-p），经过验证：p=0.7。因此，我们得到，如果A参与人踢向左方的概率为70%，并且，B参与人相应地做出最优反应，那么，A参与人将获得的期望收益为50×0.7+90×0.3=62。　　那么B参与人的情况又如何呢？对于他的选择，我们可以进行相似的分析。假定B参与人选择扑向左方的概率是q，从而扑向右方的概率我（1-q）。由此，当A参与人踢向左方时，A参与人的期望收益是50q+80（1-q）；当A参与人踢向右方时，A参与人的期望收益是90q+20（1-q）。对于任意的q，B参与人将使得A参与人的收益最小化。这种情况下，A参与人当然会选择踢向左方。　　同样的我们可以得到A参与人最大收益点，下面的式子成立：50q+80（1-q）= 90q+20（1-q），这就意味着q=0.6。迄今为止，我们已经计算出了这两个参与人的均衡策略，A参与人应该按概率0.7踢向左方，B参与人应该以概率0.6扑向左方。这些概率值使得无论对方采取什么行动，A参与人和B参与人都得到相等的收益，这是因为，我们是通过使对方选择两个策略所给出的收益相等，来确定这些概率值的。　　因此，当A参与人选择p=0.7时，B参与人在扑向左方和扑向右方之间无差别，或者，基于此，他可以选择按任意的概率q扑向左方。特别地，按概率0.6扑向左方是B参与人最乐意做的事情。类似地，如果B参与人按照概率0.6扑向左方，那么，A参与人在踢向左方和踢向右方之间无差异，或者，他可以选择这两个策略的任何混合策略。特别地，他愿意按0.7的概率踢向左方。因此，这些选择是一个纳什均衡：给定对方的选择，每一个参与人的选择都是最优的。　　3 结论　　在均衡状态下，A参与人在62%的时间内能够得分，而在38%的时间内不能得分。如果对方做出最优的选择，那么，这就是B参与人的最有选择。如果B参与人没有作出最优的反应，情况又怎样呢？我们可以得到，当p小于0.7时，B参与人将扑向左方；当p大于0.7时，B参与人将扑向右方。类似地，当q小于0.6时，