- 2
- 0
- 约 55页
- 2016-12-26 发布于重庆
- 举报
Grundy博弈(分钱币游戏) 有一堆数目为N的钱币,有两个选手轮流分堆,要求每个选手每次只把其中某一堆分成数目不相等的两小堆(如果分的相等的话,输) 以7个钱币为例。 分钱币问题 (7) (6,1) (5,2) (4,3) (5,1,1) (4,2,1) (3,2,2) (3,3,1) (4,1,1,1) (3,2,1,1) (2,2,2,1) (3,1,1,1,1) (2,2,1,1,1) (2,1,1,1,1,1) 对方先走 我方必胜 分钱币问题状态空间图 中国象棋 一盘棋平均走50步,总状态数约为10的161次方。 假设1毫微秒走一步,约需10的145次方年。 结论:不可能穷举。 目标:寻找一步好棋,等对手回敬后在考虑寻找另一步好棋这种实际可行的策略。 1,极小极大搜索过程(1) 是博弈树搜索的基本方法,目前常用的?-?剪枝搜索方法,也从极小极大搜索过程发展而来。 假定一个评价函数可以对所有的棋局进行评价: 当评价函数0时,表示对我方有利,越大越有利; 当评价函数0时,表示对对方有利,越小越有利。 极小极大搜索过程(2) 假定双方都是对弈高手,在决定走棋时,会尽可能多看几步,并都选评价函数有利的走棋。 极小极大搜索过程模拟人下棋的思考过程 策略 极小极大搜索策略是考虑双方对弈若干步之后,从可能的走步中选一个相对较好的走法来走,即在有限的搜索深度范围内进行求解。 定义静态估计
原创力文档

文档评论(0)