一个幻影围棋计算机博弈系统设计和实现.docxVIP

一个幻影围棋计算机博弈系统设计和实现.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个幻影围棋计算机博弈系统设计和实现 摘要: 幻影围棋作为一个刚兴起不久的棋类游戏,属于不完全 信息博弈,目前对幻影围棋的研究与开发较少,在国内才刚 刚起步。分析了幻影围棋计算机博弈系统的模型与结构,结 合Alpha-Eeta搜索算法和蒙特卡洛算法的优势,依据棋盘 状态采用不同的搜索算法,调用搜索引擎产生下子,在此基 础上开发实现了一个幻影围棋博弈系统,能有效的交互和处 理信息,并通过了运行测试。 关键词: 计算机博弈;幻影围棋;不完全信息博弈;Alpha-Beta; 蒙特卡洛 中图分类号:TP18文献标识码:A文章编号:1005-3824 (2014) 01—0001—06 0引言 计算机博弈是人工智能领域的重要课题,目前,对于像 国际象棋、九路围棋等棋类游戏的研究已相对成熟,幻影围 棋作为一个刚兴起不久的棋类游戏,属于不完全信息博弈。 该棋是在围棋规则的基础上加入了信息不完全的限制,即双 方均无法获取对手的棋子位置信息,由裁判根据双方棋盘状 态返回的命令进行操作[1]。国际计算机奥林匹克从2007年 开始加入幻影围棋项目,由中国人工智能学会举办的中国计 算机博弈锦标赛于2012年加入计算机幻影围棋比赛。 在过去的半个多世纪里,世界各地的学者投入了大量的 精力来研究基于棋类游戏的计算机博弈,产生了很多理论和 算法。对于计算机围棋,其博弈求解的主要方法就是在其博 弈树中搜索,博弈搜索的目标就是搜索最佳路径,搜索当前 的最佳着法,并且亦步亦趋地进行下去[2]。搜索的算法包 括极大极小搜索[3], Alpha-Beta剪枝搜索[4]、迭代加深 [5]、置换表[6]、负极大值搜索[7]、蒙特卡洛模拟[8]和UCT 算法[9]等。针对不完全信息博弈的幻影围棋,文献[10]中 提出了与围棋中类似的蒙特卡洛算法,为处理隐藏信息,需 要在每次模拟前随机地猜测对手棋子的位置,并放上对手的 棋子。文献[11]中提出了 4种不同的蒙特卡洛方法,通过实 验验证了文献[10]中所提方法的有效性[11]。但该搜索方法 存在较大的随机性,无法获取较为完整的对手棋子信息。 本文探讨了 Alpha-Beta剪枝搜索算法和蒙特卡洛算法, 引入了搜寻对方棋子信息的策略,通过此探寻策略获取更多 的对手棋子信息,然后结合2种算法在完全信息与不完全信 息博弈的优势,依据棋盘状态采用不同的搜索算法,并在此 基础上开发出了一个完整的幻影围棋博弈系统。 1系统的结构与功能模块 幻影围棋博弈系统的结构如图1所示,主要分为3部分: 一是当前棋盘状态控制部分,其中应该包含己方棋子的所有 信息和经过逻辑判断所得出的对方棋子的部分信息;另一个 部分是信息交互和处理,对于选手机,主要是接受裁判返回 的各种信息以及生成信息,然后通过这些信息对自己所掌握 的信息进行更新。对于裁判机,主要是接受选手机发来的信 息,然后根据幻影围棋规则返回相应的信息;第三个部分就 是评估搜索,该部分会根据目前的棋盘状态,采用搜索算法 和估值策略,并从所有着法中选择最优的着法作为当前着 法。 1) 1)棋盘状态控制模块: 该模块包括棋盘界面的绘制, 棋谱的绘制及计时等功能。 2)信息交互和处理模块:该模块主要包括选手机与裁 判机的通信,选手机或裁判收到信息后,针对不同信息进行 相应的处理。 3) 3)评估搜索模块:该模块包括静态棋盘估值、 IBII Alpha-Beta剪枝搜索算法和蒙特卡洛算法。 盘面评估与博弈搜索是计算机博弈的2个重要组成部 分,是计算机博弈系统智能化的重要方法[12] o要实现对战 就必须加载能让机器走子的策略,要实现效果比较好的对弈 结果,就必须加载智能化的搜索策略。本文采用Alpha-Beta 剪枝搜索算法和蒙特卡洛算法相结合的策略,根据两者的优 势,依据棋盘状态采用不同的搜索算法。 Alpha-Beta剪枝搜索算法在极大极小搜索算法的基础 上加入了剪枝策略,减少了博弈树的节点数,提高了搜索效 率。在完全信息博弈的条件下,该算法能配合静态棋盘估值 函数找到估值最大的着法。该方法在本系统中的应用:先通 过盘面扫描搜索所有可下点,然后针对每个可下点通过展开 博弈树,运用递归的算法对深度为3层的节点进行估值,返 回估值最大的根节点所对应的着法。图2 (a)和2 (b)分 别是Alpha剪枝和Beta剪枝的过程。由图2 (a)可知,根 节点下面有3个子节点和9个孙节点(叶节点),搜索从左 路分枝开始,根节点所在的MAX层的值是由该分支的叶子节 点倒推得到的,记为Alpha,值为6o然后中路分支搜索到 叶子节点发现值为5,小于Alpha值,则减掉该分枝,同理 右路分枝也做相同的处理,此类剪枝是Alpha剪枝。 从图2b可知,根节点下面有3个子节点和9个孙节点 (叶节点),搜索从左路分枝开始,

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档