(基于的手机围棋游戏的设计.docVIP

  • 0
  • 0
  • 约 20页
  • 2017-01-26 发布于四川
  • 举报
(基于的手机围棋游戏的设计

6 张国平等:基于 J2ME 的手机围棋游戏的设计 第 41 卷 图 2 LCDUI 体系结构 Bound )在 Tree Search 上的应用。而 UCB 本来是为了解决 吃角子老虎机问题( Bandit Problem )而产生的。 UCB 公式 表示如下(也称为 UCB1) [ 8~9 ] : 珡 X j + 2logn T j ( n 槡 ) (1 ) 珡 X j 是第 j 台机器到目前为止的平均收益; T j ( n )是第 j 台 机器被测试的次数; n 是所有机器目前被测试的总次数。 让式( 1 )的值最大的机器将是下一个被选择的机器。前项 即为此台机器的过去表现,后项则是调整参数。 而 UCB1-TUNED 是相对于 UCB1 实验较佳的配置策 略 [1 0] 。 UCB1-TUNED 的公式如下 V j ( s )= 1 g ∑ s Y=1 珡 X 2 j , ( ) Y - 珡 X 2 j , S + 2logn 槡 g (2 ) 珡 X j + logn T j ( n ) min 1 4 , V j ( T j ( n 槡{ } )) (3 ) 让式( 3 )的值最大的机器将是下一个被选择来测试的 机器。 UCT( UCB for Tree Search )其 实 就 是 把 UCB1 或 UCB1-TUNED (统称为 UCB )等公式运用于 Tree 

文档评论(0)

1亿VIP精品文档

相关文档