MathorCup竞赛优秀论文.docVIP

  • 155
  • 0
  • 约2.2万字
  • 约 31页
  • 2019-09-25 发布于江苏
  • 举报
PAGE 11 PAGE 16 评委一评分,签名及备注 队号: 10302 评委三评分,签名及备注 评委二评分,签名及备注 选题: A:2048 评委四评分,签名及备注 题目:基于Monte Carlo局面评估和UCT博弈树搜索的2048 摘要 本文首先提出Random-Max-Trees算法来实现人工智能的2048。此算法是通过静态评估函数来求得最优解。但是在实现的过程中出现冗余的现象,当移动方格步数过多的时候,好的评估函数却很难找到,使Random-Max-Trees算法效率降低。随后本论文采用Alpha-Beta算法,是前者的一种改进,在搜索结点数一样的情况下,可以使搜索深度达到原来的两倍。在实现的过程中发现Alpha-Beta严重依赖于着法的寻找顺序。只有当程序挑最好的子节来当先搜索,才会接近于实际分枝因子的平方根,也是该算法最好的状态。但是在首先搜索最坏的子节时,Beta截断不会发生,此时该算法就如同Random-Max-Trees一样,效率非常低,也失去Alpha-Beta的优势,也无法试图通过面的搜索来弥补策略上的不足。 本文采用蒙特卡洛评估对以上模型进行了改进。它通过对当前局面下的每个的可选点进行大量的模拟来得出相应的胜负的统计特性,在简单情况下,胜率较高的点就可以认为是较好的点予以选择。由于UCT算法能不断根据之前的结果调整策略,选择优先评估哪一个可

文档评论(0)

1亿VIP精品文档

相关文档