一种基于虚拟遗憾最小化算法的德州扑克AI训练方法.pdfVIP

  • 27
  • 0
  • 约1.04万字
  • 约 11页
  • 2023-06-05 发布于四川
  • 举报

一种基于虚拟遗憾最小化算法的德州扑克AI训练方法.pdf

本发明涉及一种基于虚拟遗憾最小化算法的德州扑克AI训练方法,包括以下步骤:1)获取私人手牌信息和游戏展示信息,进行游戏特征抽象;2)基于玩家历史游戏日志,建立针对该玩家的策略预测神经网络模型;3)采用虚拟遗憾最小化算法以玩家的策略预测神经网络模型为对手训练并得到AI行为策略;4)采用训练得到的AI行为策略与游戏玩家进行实时对局,并再结束后进行比赛记录。与现有技术相比,本发明通过引入游戏信息抽象嵌入,将遗憾匹配机制和局部最小遗憾值计算方法整合到遗憾最小化算法中,具有提高计算效率和实际对局胜率的优点

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112691383 A (43)申请公布日 2021.04.23 (21)申请号 202110048898.X (22)申请日 2021.01.14 (71)申请人 上海交通大学 地址

文档评论(0)

1亿VIP精品文档

相关文档