公平组合博弈的法初探.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
公平组合博弈的解法初探 信息科学技术学院 姚金宇摘要:公平组合博弈是博弈论中的一类基础问题,也是进行深入研究的基础。本文介绍了公平组合博弈的基本理论,并对具体问题的分析,阐述了其应用方法,尤其是如何将公平组合博弈的联合的理论应用于较复杂的博弈问题中。此外,还从游戏设计的角度探讨了如何在约束条件下设计游戏初始局面的问题。 关键字:博弈论 公平组合博弈 引言 博弈论(Game Theory)是一个古老而迷人的学科。一些简单的博弈问题经过数学模型的抽象后能够得到完备的解决,或者得到在概率论下的理想解释。我们经常会碰到诸如此类的问题: 游戏1:有n枚石子组成的石碓,两人轮流进行游戏。每次游戏者可以取走石碓中不超过k枚的石子。谁取走最后一颗石子为胜。 游戏2:有n堆石子,第i堆有ai枚。两人轮流进行游戏,每次游戏者可以从任意一堆石子中取走任意多个。谁取走最后一颗石子为胜。 游戏3:有n堆石子,第i堆有ai枚,两人轮流进行游戏,每次游戏者可以从任意一堆取走任意多枚石子,也可以将任意的一堆石子任意的分成两堆。谁取走最后一颗石子为胜。 游戏4:把上面三个游戏联合起来,即同时玩所有的游戏,但每人每一次只能进行某个游戏的某一步,不能继续进行下去的人算输。 我们还可能碰到更为复杂的问题,比方说下面的二维硬币游戏: 游戏5:在一个T*T的方格阵中,每个格子里放一枚硬币。有的正面朝上,有的反面朝上。两个人做游戏,轮流翻硬币。规则是这样的:选一个跟方格阵平行的矩形,将它的四个角上的硬币翻转,并且要求矩形的右下角必须从正面翻到反面。不能操作的人就输了。 上述问题的提出都是从游戏参与者的角度考察胜负情况。有时候我们还需要从游戏设计者的角度,在某些限制条件下设计出满足要求的游戏局面,例如下面的问题: 问题6:在游戏5中,要求设计出一个初始局面,使得先手必败。但必须满足一定的约束条件:在某些实现规定的位置必须放置正面向上或者反面向上的硬币。 本文的目的就是针对上述问题,对相关游戏操作和游戏设计的解法进行系统的理论分析。就问题6而言,我们至少需要解决两个方面的子问题:1.先手必败的充要条件是什么;2.如何在约束条件下实现这个充要条件。为了解决这些,我们先从博弈论中的公平组合博弈的基本理论着手。 公平组合博弈(Impartial Combinatorial Game)的基本理论 本节内容大部分援引自参考文献[1] 2.1公平组合博弈的定义 本文所讨论的公平组合博弈,是指满足下面几个条件的博弈游戏: 它是两人参与的游戏 游戏局面的状态集合是有限的 对于同一个局面,两个游戏者的可操作集合完全相同 游戏者轮流进行游戏 当无法进行操作时,游戏结束,此时不能进行操作的一方算输 无论游戏如何进行,总可以在有限步之内结束。(the Ending Condition) 逐条验证我们不难发现,引言中提到的五个游戏都满足公平组合博弈的定义,因此都属于本文所讨论的范畴。公平组合博弈是博弈论中最简单的博弈类型之一,也是对于其他类型深入讨论和研究的基础。 2.2 N局面和P局面 由于公平组合博弈在有限步之内必定会结束,因此不存在平局的状况。我们可以得到这样的结论:在两个游戏者都采用最佳策略的前提下,对于每一个游戏局面,要么就是先手必胜,要么就是后手必胜。我们称先手必胜的局面为N局面(N-position, winning for the Next player),后手必胜的局面为P局面(P-position, winning for the Previous player)。我们可用下面的方式定义N局面和P局面 定义1: 每一个最终局面都是P局面 对于一个局面,若至少有一种操作使它变成一个P局面,则它是一个N局面 对于一个局面,无论如何操作都必然变成一个N局面,则它是一个P局面 2.3 Sprague-Grundy函数 对于一般的博弈问题,要判断一个局面是N局面还是P局面往往需要利用博弈树模型,即穷举所有可能的操作步骤,然后根据性质1自底向上逐个局面进行判断。在公平组合博弈中,我们还可以通过Sprague-Grundy函数(以下简称SG函数)来判断N局面和P局面。 在定义SG函数之前,我们先定义一个局面的后继局面的概念: 定义2:局面y被称为局面x的后继局面,当且仅当局面x可以通过一步操作变成局面y。我们把局面x的后继局面的集合定义为F(x). 定义3:在非负整数集上定义局面x的SG函数g(x)如下: QUOTE 通过下面的定理,我们可以建立SG函数与N局面和P局面的关系: 定理1:对于任意的局面x,若g(x)=0则x是P局面,否则x是N局面. 证明:我们对局面作数学归纳法: 对于最终局面x,由定义x是P局面,而此时g(x)=

文档评论(0)

yx118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档