基于PVS搜索算法的亚马逊棋博弈系统的设计.docx

下载文档 降价啦

76
0
约3.41千字
约 7页
2019-01-12 发布于山东
举报
版权申诉
保障服务

基于PVS搜索算法的亚马逊棋博弈系统的设计.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于PVS搜索算法的亚马逊棋博弈系统的设计 Abstract： The game of the Amazons is a game in which the complexity stands between the game of Go and Chinese Chess. Because of the huge branching factor， it is difficult to reach higher depth in the search process.Combined with heuristic and hash technology， this paper uses the PVS algorithm， and greatly improves the pruning efficiency and the search depth. The Amazons game software developed by this technology has improved the game level effectively. 引言亚马逊棋是一种颇受欢迎的较新的棋盘类游戏，其行棋规则和复杂度均介于围棋和国际象棋之间。由于亚马逊棋类设计中含有较大的分支因子，使其非常适合于搜索算法的研究。亚马逊棋的棋盘构成则如图1所示。研究中，将给出亚马逊棋的布棋规则可表述如下。（1）在10×10的棋盘上红方（白方）在A4、D1、 G1和 J4位置上摆放白方4个皇后，蓝方（或黑方）在A7、 D10、G10和 J7位置上摆放黑方4个皇后。（2）皇后可走棋的位置与国际象棋皇后走法的规则相同。（3）由红方（或白方）开始游戏，每轮下棋由2步组成： ① 移动摆放皇后位置，规则和国际象棋皇后走棋的规则相同。 ② 落子后以当前皇后位置为基点设置障碍，障碍摆放点的位置和皇后可摆放点的位置相同（两者使用的规则相同）。（4）皇后和障碍设置的线路上不得有其它棋子或障碍。（5）可以完成最后一步的一方为赢家。根据亚马逊棋的规则计算，亚马逊棋的平均分支因子达到17 000左右。与围棋相比，仅仅只是表现在规则相对简单，及搜索深度相对较小。因此，非常适合搜索算法的研究。亚马逊棋的博弈系统主要由估值和搜索两大部分组成，在本文中所用的估值研究包含3个方面，分别是：灵活度、位置和领域[1-2]，本文探讨的主要内容则为搜索算法，对其详述如下。 1基于PVS算法的搜索引擎研究可知，由于亚马逊棋的较高复杂度，将使其难于达到较高的搜索效率。目前，常用的方法有UCTS算法[3]、哈密尔顿环方法[4]等。其中，UCTS算法可以获得较高的搜索深度，但估值的精确性较差，而相对来说，哈密尔顿环的执行效率却会偏低。本文采用的是基于PVS算法的搜索引擎，结合Amazons棋的特点，并且引入置换表技术和历史启发技术，该次研究旨在获得较高的搜索效率，同时能够对局面进行准确估值。 PVS是alpha-beta剪枝搜索算法的一个变种算法，其设计重点在于除主变量节点外的其它所有节点都用一个零窗口（alpha，beta）且alpha=beta 进行搜索，遵循理念就是对浅层的节点进行整理使其基本有序，并假设第一个节点是最好的，作为主变量，展开全窗口搜索。通过零窗口搜索其它节点，判断是否存在一些节点会比当前最优值更好。如果符合alpha-beta剪枝则进行剪枝，假若失败则证明当初的节点不是主变量，即需对当前节点重新发起一次全窗口搜索，作为新的主变量。本文结合了历史启发增强和置换表技术，确保了搜索效率及速度。置换表技术用于在搜索到结果的情况下记录最好的评分和方法，并在下一次搜索中直接返回相同的情况，大大提高了搜索效率。通常一个局面经搜索被判定为较好时，在其后继结点中往往有一些相似的局面也是较好的。历史启发就是建立在这样一种论点之上的。在搜索过程中，每当找到好的行棋方式时，加入一个增量来记录其历史分数，而经多次搜索均认定为是好方式的历史分数即会更高。对于即将到来的节点，可根据历史评分进行排序。如此一来，更好的行走方法（历史评分行棋方法）就可位列在前面，从而确保搜索的效率。 2实验与分析博弈系统的性能可以从胜负和访问的节点数这2个方面进行比较。对此可阐释分述如下。 2.1胜负比较胜负上的比较是对博弈系统棋力水平的直观呈现。因为每个博弈系统的最终目的便是证实自己具有较高的棋力水平。在相同限制条件下进行博弈，就可有效评判该博弈系统的水平高低。首先双方博弈系统基于同一个估值函数，将PVS搜索迭代时间限定在1 s，将alpha-beta剪枝搜索算法的最大深度限定在11层。然后设置基于PVS算法的博弈系统为先手，alpha-beta剪枝算法为后手，对弈一定局数以后，先、后手互换。接着为PVS