- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
谷歌人工智能破解围棋比赛首胜欧洲冠军.PDF
当前文档由后花园网文自动生成,更多内容请访问 HTTP://WWW.HHYWW.NET
谷歌人工智能破解围棋比赛 首胜欧洲冠军
来源于:安卓网
新浪科技讯 1月28日上午消息,谷歌今日宣布在人工智能领域的重要进展
:开发出一款能够在围棋中击败职业选手的程序——AlphaGo,该程勋能够通过
机器学习的方式掌握比赛技巧。
人工智能挑战围棋有多难?
计算机和人类竞赛在棋类比赛中已不罕见,在三子棋、跳棋和国际象棋等
棋类上,计算机都先后完成了对人类的挑战。但对拥有2500多年历史的围棋而
言,计算机在此之前从未战胜过人类。围棋看起来棋盘简单、规则不难,纵横
各19九条等距离、垂直交叉的平行线,共构成19times;19(361)个交叉点。比
赛双方交替落子,目的是在棋盘上占据尽可能大的空间。
在极简主义的游戏表象之下,围棋具有令人难以置信的深度和微妙之处。
当棋盘为空时,先手拥有361个可选方案。在游戏进行当中,它拥有远比国际象
棋更多的选择空间,这也是为什么人工智能、机器学习的研发者们始终希望在
此取得突破的原因。
就机器学习的角度而言,围棋的计算最大有3361种局面,大致的体量是
10170,而已经观测到的宇宙中,原子的数量才1080。国际象棋最大只有2155种
局面,称为香农数,大致是1047。
“机器学习”预测人类行为
传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法
对围棋并不适用。此次谷歌推出的AlphaGo,将高级搜索树与深度神经网络结合
在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百
万个类似于神经的连接点。
其中一个神经网络“决策网络”(policy network)负责选择下一步走法
,另一个神经网络“值网络”(“value network)则预测比赛胜利方。谷歌方面
用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行
研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接
点,这个流程也称为巩固学习(reinforcement learning)。通过广泛使用
Google云平台,完成了大量研究工作。
AlphaGo所使用的神经网络结构示意图
征服围棋对于谷歌来说有重要意义。AlphaGo不仅是遵循人工规则的“专家
”系统,它还通过“机器学习”自行掌握如何赢得围棋比赛。谷歌方面希望运
用这些技术解决现实社会最严峻、最紧迫的问题——从气候建模到复杂的灾难
分析。
在具体的机器训练上,决策网络的方式是输入人类围棋专家的比赛,到系
统可以预测57%人类行动为止,此前最好成绩是44%。此后AlphaGo通过在神经网
络内部进行比赛的方式(可以简单理解成和自己下棋),开始学习自主探索新的
围棋策略。目前AlphaGo的决策网络可以击败大多数具有庞大搜寻树的最先进的
围棋程序。
值网络也是通过自己和自己下棋的方式来训练。目前值网络可以评估每一
步棋能够有多大胜算。这在此前被认为是不可能的。
AlphaGo战绩惊人
实际上,目前AlphaGo已经成为最优秀的人工智能围棋程序。在与其他程序
的对弈中,AlphaGo用一台机器就取得了500场的胜利,甚至有过让对手4手后获
胜的纪录。去年10月5日-10月9日,谷歌安排AlphaGo与欧洲围棋冠军Fan
Hui(樊麾:法国国家围棋队总教练)闭门比赛,谷歌以5-0取胜。
AlphaGo与欧洲围棋冠军樊麾的5局较量
公开的比赛将在今年三月举行,AlphaGo将在韩国首尔与韩国围棋选手李世
石九段一决高下,李世石是近10年来获得世界第一头衔最多的棋手,谷歌为此
提供了100万美元作为奖金。李世石表示很期待此次对决,并且有信心获得胜利
。
文档评论(0)