计算机围棋博弈的最新发展-全国计算机博弈大赛.ppt

下载文档 降价啦

2
0
约4.72千字
约 29页
2019-05-31 发布于天津
举报
版权申诉
保障服务

计算机围棋博弈的最新发展-全国计算机博弈大赛.ppt

1、本文档共29页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

计算机围棋的最新发展北京邮电大学北邮九鼎计算机围棋研究所刘知青提纲计算机围棋博弈研究的意义及其主要困难计算机围棋博弈的发展历史传统的计算机围棋博弈技术现代的计算机围棋博弈技术蒙特卡罗模拟信心上限算法与信心上限应用树算法蒙特卡罗树搜索并行与分布式计算总结与展望计算机围棋博弈研究的意义科学技术意义机器学习模式识别自然语言理解分布式高性能计算社会意义国防建设教育娱乐围棋是最具挑战性的计算机博弈年许峰雄博士领导的团队在国际象棋上战胜了世界冠军年徐心和教授领导的东北大学棋天大圣团队在中国象棋上战平了全国冠

计算机围棋的最新发展北京邮电大学北邮?九鼎计算机围棋研究所刘知青提纲计算机围棋博弈研究的意义及其主要困难计算机围棋博弈的发展历史传统的计算机围棋博弈技术现代的计算机围棋博弈技术蒙特卡罗模拟信心上限算法与信心上限应用树算法蒙特卡罗树搜索并行与分布式计算总结与展望计算机围棋博弈研究的意义科学技术意义机器学习模式识别自然语言理解分布式高性能计算社会意义国防建设教育娱乐围棋是最具挑战性的计算机博弈 1997年，许峰雄博士领导的IBM Deeper Blue团队在国际象棋上战胜了世界冠军。 2006年，徐心和教授领导的东北大学棋天大圣团队在中国象棋上战平了全国冠军。围棋是唯一一个计算机博弈水平仍远低于人类博弈水平的传统博弈现在，最强的19路计算机围棋能达到被职业棋手让大约7-9个子的水平。计算机围棋博弈的基本方法博弈树搜索通过搜索博弈树进行落子选点当博弈树搜索过程可以终结的时候，该搜索过程会找到最优落子点，并同时证明该落子选点是最优的专家系统通过使用具有知识、规则、推理的专家系统进行落子选点。计算机围棋博弈的二大核心困难搜索无法终结 – 无法有效地终结在围棋博弈树上的传统搜索过程围棋具有巨大的状态空间复杂度和博弈树复杂度提前终结搜索依赖于准确的静态盘面评估，而围棋从本质上无法做准确的静态盘面评估落子选点无法验证 – 围棋专家系统的构建非常复杂，其落子选点无法经过严格的验证（例如，数学证明，或搜索验证）巨大的状态空间和博弈树复杂度围棋具有巨大的状态空间复杂度和博弈树复杂度状态空间复杂度（用于搜索）十九路围棋：10172 国际象棋：1046 中国象棋：1048 博弈树复杂度（用于决策）十九路围棋： 10300 国际象棋： 10123 中国象棋： 10150 不可能的准确静态盘面评估围棋从本质上无法做准确的静态盘面评估分析围棋棋子位置，数目的多少，以及棋子之间的静态关系（例如影响函数）无法完整地和准确地评判围棋棋子的作用与最终死活围棋棋子的作用与最终死活必须由博弈的具体进程所决定完整和准确的围棋盘面评估也无法静态地完成过早的终结围棋搜索无法得到有效的盘面评估结果（例如，α-β搜索）无法验证专家系统的落子选点通过知识、规则和推理不可能构建高水平的计算机围棋博弈专家系统知识和规则通常局限在局部和低层次上围棋的知识和规则过于复杂，例外极多通过专家系统所产生的局部落子选点无法经过严格的全局验证计算机围棋博弈的发展历史传统计算机围棋博弈技术（1968至2005）现代计算机围棋博弈技术（2006至今）分水岭（2006) -- UCT算法的出现及其在计算机围棋博弈上的应用传统的计算机围棋博弈技术基于影响函数的形势判断使用模式生成落子候选点开局定式，手筋，等等。表示人类所使用的围棋抽象串，群，眼，眼位，等等。局部搜索吃和逃（征子），连结和切断，死活，等等。全局搜索（使用得非常有限）现代计算机围棋博弈技术现代计算机围棋博弈主要使用的关键技术：蒙特卡罗模拟（Monte Carlo Simulation）信心上限算法（UCB，Upper Confidence Bounds）信心上限应用树算法（UCT，UCB applied to Trees）蒙特卡罗树搜索（MCTS ，Monte Carlo Tree Search）高性能计算（High Performance Computing）蒙特卡罗模拟用于围棋形式评估从所需评估盘面开始进行随机对弈至终局把终局结果返回给所需评估盘面以大量模拟的期望值来评估该盘面参考文献 Abramson, B. (1990). Expected-outcome : a general model of static evaluation. IEEE transactions on PAMI, Vol. 12, pp. 182–193. Bruegmann, B. (1993). Monte Carlo Go. /vegos/MonteCarloGo.pdf 蒙特卡罗模拟的特点蒙特卡罗模拟可以看作是博弈树上单个路径上的搜索，并有以下二个特点：搜索可快速终结 2GHz Pentium，10000盘/秒九路围棋蒙特卡罗模拟十九路围棋的蒙特卡罗模拟速度大约是九路围棋的1/4 选点可快速验证选点的优劣可根据终局结果在一定程度上得以验证终局结果通过中国围棋规则进行简单评判缓解了计算机围棋博弈的二大主要困难增加模拟时间可以方便地提高总体的评估效果蒙特卡罗模拟的效果与局限性蒙特卡罗模拟的效果是明显的： 1993年，Gobble在286PC上达到九路围棋25级的水平在UCT算法