- 2
- 0
- 约 19页
- 2016-11-27 发布于湖北
- 举报
博弈理论初步 信息完全的零和博弈 概要 博弈定义 博弈评价 博弈最佳解 最大最小 非确定性博弈 博弈类型 定义 俩人对弈:玩家A和B,A先手。 确定性:移动或状态不受制于机会,即不是随机抽取的。 信息完全:俩玩家亲历所有的状态及决定。每个决定都是顺序做出的。 零和:A获得的等于B损失的。一个玩家必须赢,或是平局,即双方得到的是等同的。 例子 开始,一叠硬币放在俩玩家之间。 每个玩家将其中一叠硬币分成不同的两叠。 当每叠只有一或两枚硬币时,对弈结束。 第一位不能继续的玩家输。 例子 搜索问题 状态:棋盘构形+下家 后续态:通过合法移动,当前态能到达的一系列状态 终态:博弈结束的状态 回报或效用:赋给每个终态的数值 例如:U(s)=+1:A赢,?1:B赢,0:平局 博弈值:假设俩玩家都采用最佳策略,这样到达的一个终态的值,称为最大最小(minimax)值。 搜索:寻找从当前态开始,并使博弈值极大的移动 博弈树 最佳(或最大最小)策略 搜索博弈树,使得: A手:寻找从相应的亚树开始的,能产生最大回报的移动。该移动对A最有利 B手:寻找从相应的亚树开始的,能产生最小回报的移动。该移动对B最有利 最大最小(Minimax) 计算从当前态起始的最大最小策略: Minimax(s) if s是终态 返回U(s) else if 下一步是A手 返回 else 返回 例子 最大最小
原创力文档

文档评论(0)