- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
o
o
C 蒙特卡罗方法在计算机 围棋
[
U
卜~ 中的应用
■文 /SylvainGelly JoannaJongwane
博弈程序的一般原理 在围棋、跳棋(DAMES)或者黑白棋 (OTHELLO)等等博弈
从抽象的组合策略层面来说,所有的博弈程序都有着 中,我们却通过一种简单的算法就可以在理论上找到最佳
相同的博弈规则。博弈程序建立了一个对应于解析博奔步 策略,即只需要建立包括了所有可能性的 “策略树”就足
骤序列的 “策略树”。在此 “策略树”中,每一节点代表博 够了。该 “策略树”包含了大量的数据,但在实际计算程
弈中的落子点。该 “策略树”代表了所有可能的博弈落子点, 序中,它又不可能包括所有的数据。这一点显示出,为了
以及达到每一落子点的所有可能的方式。 实现这一目标,还需要智能技术的帮助。所有的这些技
术——即为了实现在人工智能方面找寻出大多数的方案的
结果——都有一个共同点,它们没有力图能研究出所有的
可能性,而是仅仅把重点放在战胜对手的博弈步骤上。
UCT,一种树搜索算法
阿尔法一D算法 (Algorithmalpha—beta)被认为是在组
合博弈领域的范例。特别是在国际象棋中被广泛而有效的
图片来源 :法国国家信息与自动化研究所 应用,该算法认为:着手于研究某些随机的博弈步骤,接
照片提供:克雷斯蒂安·图尼艾尔 下来研究其对应的步骤,如果很显然的对策步骤还不如最
在对所有可能的博弈步骤 “策略树”进行研究后,我 初步骤时,我们就舍弃这种步骤……实施这些被我们称之
们可能找出最好博弈步骤,即如果我们采取这一博弈步骤 为步骤的东西:减少这种分支因素,也就是说子节点的数
时,对手没有任何方式来阻止我们获得博弈的胜利,而不
论对手在博弈中的怎么做。我们可以计算出我们应采取的 Max
博弈步骤直到博弈结束,从而找出那些最优的博弈步骤。
.
这也就是我们称之为最大最小策略。为什么是最大最小策 Mm 觚
略呢?简单的说,这是因为博弈方X寻找最优的博弈步骤,
他的对家Y试图阻止他去实现这些最优步骤。从X方的角
度来说,Y方只能采用最差的博弈步骤。换句话说,我们
也可以说其对手Y方被抑制发挥到极小 (最差)时,而X
方可以发挥到极大(最好)。这当然是博弈希望达到的目标,
这是一个最理想的结果。但有时,这不是最好的选择。
在莫戈程序 (MOGO)和大多数的围棋 (GO)博弈
中,我们总是试图能够实现这种最大最小的理想效果。对
您可能关注的文档
最近下载
- 《关于促进人工智能和实体经济深度融合的指导意见》解读.pdf VIP
- 互联网数据中心基础设施监控系统北向接口规范V1.1.pdf VIP
- 软件配置管理计划(模板)-GJB438C.docx VIP
- 2024年3月17日多省(市、区)公务员考试《公安专业科目》真题及答案 .docx VIP
- 污水处理厂化验员工试题带答案.docx VIP
- 路基路面中线偏位试验检测记录表(坐标法).docx
- 广东省某焦化厂废水处理工艺设计.docx
- SY-T 5824-93钻杆分级检验方法.pdf VIP
- 2021届高三地理第一轮复习中国地理中国的自然环境专题跟踪训练.docx VIP
- 2021年12月12日江苏省公务员考试《公安专业科目》试题(网友回忆版).docx VIP
文档评论(0)