蒙特卡罗方法在计算机围棋中的应用.pdfVIP

蒙特卡罗方法在计算机围棋中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
o o C 蒙特卡罗方法在计算机 围棋 [ U 卜~ 中的应用 ■文 /SylvainGelly JoannaJongwane 博弈程序的一般原理 在围棋、跳棋(DAMES)或者黑白棋 (OTHELLO)等等博弈 从抽象的组合策略层面来说,所有的博弈程序都有着 中,我们却通过一种简单的算法就可以在理论上找到最佳 相同的博弈规则。博弈程序建立了一个对应于解析博奔步 策略,即只需要建立包括了所有可能性的 “策略树”就足 骤序列的 “策略树”。在此 “策略树”中,每一节点代表博 够了。该 “策略树”包含了大量的数据,但在实际计算程 弈中的落子点。该 “策略树”代表了所有可能的博弈落子点, 序中,它又不可能包括所有的数据。这一点显示出,为了 以及达到每一落子点的所有可能的方式。 实现这一目标,还需要智能技术的帮助。所有的这些技 术——即为了实现在人工智能方面找寻出大多数的方案的 结果——都有一个共同点,它们没有力图能研究出所有的 可能性,而是仅仅把重点放在战胜对手的博弈步骤上。 UCT,一种树搜索算法 阿尔法一D算法 (Algorithmalpha—beta)被认为是在组 合博弈领域的范例。特别是在国际象棋中被广泛而有效的 图片来源 :法国国家信息与自动化研究所 应用,该算法认为:着手于研究某些随机的博弈步骤,接 照片提供:克雷斯蒂安·图尼艾尔 下来研究其对应的步骤,如果很显然的对策步骤还不如最 在对所有可能的博弈步骤 “策略树”进行研究后,我 初步骤时,我们就舍弃这种步骤……实施这些被我们称之 们可能找出最好博弈步骤,即如果我们采取这一博弈步骤 为步骤的东西:减少这种分支因素,也就是说子节点的数 时,对手没有任何方式来阻止我们获得博弈的胜利,而不 论对手在博弈中的怎么做。我们可以计算出我们应采取的 Max 博弈步骤直到博弈结束,从而找出那些最优的博弈步骤。 . 这也就是我们称之为最大最小策略。为什么是最大最小策 Mm 觚 略呢?简单的说,这是因为博弈方X寻找最优的博弈步骤, 他的对家Y试图阻止他去实现这些最优步骤。从X方的角 度来说,Y方只能采用最差的博弈步骤。换句话说,我们 也可以说其对手Y方被抑制发挥到极小 (最差)时,而X 方可以发挥到极大(最好)。这当然是博弈希望达到的目标, 这是一个最理想的结果。但有时,这不是最好的选择。 在莫戈程序 (MOGO)和大多数的围棋 (GO)博弈 中,我们总是试图能够实现这种最大最小的理想效果。对

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档