- 7
- 0
- 约1.38万字
- 约 17页
- 2016-11-27 发布于湖北
- 举报
第8章 蒙特卡罗博弈方法
计算机博弈理论的研究希望计算机能够像人一样、思维、判断和推理,并能够做出理性的决策。棋类博弈由于规则明确、竞技性高,且人类选手往往胜于计算机等原因,在计算机博弈理论的研究过程中一直受到重要关注和深入的探讨,并促进了计算机博弈理论的发展。传统的基于博弈树搜索和静态评估的博弈方法在国际象棋、中国象棋等棋类项目中获得了明显的成功,该类项目的盘面估计与博弈树搜索过程相对独立,棋子在盘面中的作用相对明确,且棋局中的专家规则相对较为容易概括和总结。
然而传统的博弈理论在计算机围棋博弈中遇到了明显的困难:围棋具有巨大的搜索空间;盘面评估与博弈树搜索紧密相关,只能通过对将来落子的可能性进行分析才能准确地确定棋子之间的关系;与此同时,高层次的围棋知识也很难归纳,归纳之后常有例外,并且在手工构建围棋知识和规则的过程中常会出现矛盾而导致不一致性。这些独特的因素为围棋及拥有类似性质的计算机博弈问题研究带来了新的挑战。
从2006年开始,计算机围棋博弈的相关研究有了跨越式的发展,基于蒙特卡罗模拟的博弈树搜索算法获得了重要的成功,并开始逐步引领计算机博弈理论研究的方向。在本章,我们将介绍蒙特卡罗博弈理论及其在围棋等棋类博弈中的应用。
8.1 基本概念
8.1.1 马尔科夫决策过程
马尔科夫决策过程是序贯决策过程的主要研究领域之一,一个序贯决策过程包括以下几点:
所有的决策时刻点集;
您可能关注的文档
最近下载
- 外教社新世纪日语专业本科生系列:跨文化交际日本语言文化教程PPT课件U9.pptx VIP
- 专业带头人申请表(模板).docx VIP
- 2026雅思7.0+破壁密码:阅读听力高难同义替换(核心200组前沿学术语料)_超高清打印版.pdf VIP
- 外教社新世纪日语专业本科生系列:跨文化交际日本语言文化教程PPT课件U8.pptx VIP
- 2025内蒙古林草执法人员专场招收1605人笔试模拟试题及答案解析.docx VIP
- 涉案财物集中管理场所建设、运营管理、服务、信息平台技术规范.pdf VIP
- 生产线平衡分析和瓶颈改善dxc.ppt VIP
- 外教社新世纪日语专业本科生系列:跨文化交际日本语言文化教程PPT课件U7.pptx VIP
- 2025年内蒙古林草执法人员专场招收1605人笔试模拟试题及答案解析.docx VIP
- 2026年雅思阅读段落匹配题技巧:定位词+同义替换+排除干扰项.docx VIP
原创力文档

文档评论(0)