- 0
- 0
- 约 20页
- 2017-01-26 发布于四川
- 举报
(基于的手机围棋游戏的设计
6
张国平等:基于
J2ME
的手机围棋游戏的设计 第
41
卷
图
2 LCDUI
体系结构
Bound
)在
Tree Search
上的应用。而
UCB
本来是为了解决
吃角子老虎机问题(
Bandit Problem
)而产生的。
UCB
公式
表示如下(也称为
UCB1)
[
8~9
]
:
珡
X
j
+
2logn
T
j
(
n
槡
)
(1
)
珡
X
j
是第
j
台机器到目前为止的平均收益;
T
j
(
n
)是第
j
台
机器被测试的次数;
n
是所有机器目前被测试的总次数。
让式(
1
)的值最大的机器将是下一个被选择的机器。前项
即为此台机器的过去表现,后项则是调整参数。
而
UCB1-TUNED
是相对于
UCB1
实验较佳的配置策
略
[1
0]
。
UCB1-TUNED
的公式如下
V
j
(
s
)=
1
g
∑
s
Y=1
珡
X
2
j
,
( )
Y
-
珡
X
2
j
,
S
+
2logn
槡
g
(2
)
珡
X
j
+
logn
T
j
(
n
)
min
1
4
,
V
j
(
T
j
(
n
槡{ }
)) (3
)
让式(
3
)的值最大的机器将是下一个被选择来测试的
机器。
UCT(
UCB for Tree Search
)其 实 就 是 把
UCB1
或
UCB1-TUNED
(统称为
UCB
)等公式运用于
Tree
您可能关注的文档
最近下载
- 《公路养护工程量清单及计量规范》+解读(每日一练).docx VIP
- Soundcraft声艺Signature 22MTK Outline Dimensions file)说明书用户手册.pdf
- 深圳2026年中考语文一轮复习知识清单(词义·成语·俗语).docx VIP
- 中国脓毒症与感染性休克诊治指南(2026版).docx
- 深圳台达电气集团有限公司 TD500系列-重载矢量变频器使用说明书2022.12.2.pdf
- 常用电气符号.pptx VIP
- 贵州遵义市红花岗区2026年学业水平第一次适应性考试(一模)文综-初中历史(试卷+解析).pdf VIP
- 城市道路检查井青岛市通用图集.pdf VIP
- 焦虑自评量表和抑郁自评量表.doc VIP
- 广州数控GSK980MDi系列操作使用手册.pdf
原创力文档

文档评论(0)