从人机大战谈人工智能.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

从人机大战谈人工智能

?

?

何永华朱卫纲唐晓婧

【摘要】本文主要从围棋人机大战中AlphaGo的表现谈起,尤其是被赞为“神之一手”的称其有“吴清源”之风的“黑37”步棋,可能包含了无穷无尽的计算、判断与预谋。AlphaGo的胜利,让如今已经很火的深度学习益发成为人工智能领域的焦点,昭示了未来几年人工智能很可能会以超出我们想象的速度发展,也许能够胜任更多人类智力所不及的任务。但是,人工智能在某种程度上来说,也许并不在它的创造者的控制范围内,出于失控的风险考虑,是否有一些人工智能从一开始就不应该被发明出来?

【关键词】李世石;AlphaGo;人工智能

在今年三月份这场历史性的围棋人机(李世石和AlphaGo)大战中,世人的目光都集中在李世石和AlphaGo身上——一个是当世最伟大的围棋手,一个是全世界最好的人工智能专家花了两年时间开发出来的强大的自学习系统。

纵观韩国围棋界,李世石是继独步天下的李昌镐之后,韩国最具代表性的棋手,自2002年加冕富士通杯以来,10年时间里他共获得14个世界冠军,数量仅次于李昌镐的17个。

比赛结果是李世石1:4落后于AlphaGo。在这场举世瞩目的人机大战中,很多人折服于AlphaGo的精准、聪明和大局意识。人们问AlphaGo为什么如此厉害,工程师给出的答案是它有“两个大脑”;一个输入了3000万盘人类顶级棋手对弈数据,通过“自我对战”来进行增强学习,改善此前的决策网络;另一个通过价值网络来进行整体局面判断,决策网络与价值网络协作决定落子位置。

关于这场万众瞩目的世纪大战,赛前最大的悬念,也是构成比赛最大的魅力之一就是,赛前没有人、连谷歌DeepMind的工程师都不知道AlphaGo的棋力到了什么水平。即使比赛之后,人们仍然搞不清楚AlphaGo的棋力到底到了什么水平,以及他能够达到什么水平。

大家记忆中应该还深刻记得,最为意味深远的一幕是在第二局,AlphaGo在下第37手棋时,突然从右下角的战役中离开,跑到右上侧开阔的疆域作战。当时现场解说员迈克。西蒙(西方唯一的围棋九段职业棋手)吃了一惊,说:“这一着很怪。”另一个显然水平比较差的解说员附和着笑了一下,不经意的说:“也许是机器又犯傻了”。但李世石看到此棋一落,突然一言不发,面无表情的出去了,回来以后喝了一口咖啡,陷入了漫长的15分钟沉思。还记得李世石在赛前宣称自己将以5:0全胜。他相信下围棋这件事情里面有一些东西是机器不可能模仿的。作为人类代表,他发誓要守护围棋之美。但事实上,从第二局开始,形势已经发生了惊人的逆转。在此之前,是AlphaGo挑战李世石,但在此之后,已经是李世石在挑战AlphaGo了。10秒钟后,AlphaGo下的那一颗看似与之前的棋子毫无关联的黑棋,奇迹般的以燕尾之势与它之前的18颗黑子相联合。在围棋职业棋手们事后的不断回味中,AlphaGo的这步棋(黑37)被人赞为“神之一手”,其中似乎包含了无穷无尽的计算、判断与预谋,现场解说员甚至称其有“吴清源”之风。

AlphaGo的技术框架采用的是模仿人类大脑神经的模式,通过深度学习把人工神经网络的层级大大增加,提升了计算能力。AlphaGo的胜利,让如今已经很火的深度学习益发成为人工智能领域的焦点。

简单地说,人工神经网络是一种从信息处理角度对人脑神经元网络进行抽象,按不同的连接方式组成不同网络的算法数学模型。它由一层一层的神经元构成,层数越多就越深。而所谓深度学习就是用多层神经元构成的神经网络,以达到机器学习的功能。这些多层的电脑网络像人类大脑一样,可以收集信息,并基于收集到的信息产生相应的行为,也就是“认识”事物,并做出行动。

按照谷歌DeepMind的联合创始人德米斯.哈萨比斯赛前的说法,这也是创造AlphaGo出来的初衷:让机器学会像人类一样学习。

到目前为止,人类仍然是这个星球上最擅长学习的物种——李世石可以在四盘棋局里不断调整策略,并成功找到AlphaGo的弱点,而AlphaGo在此期间却没有任何办法做任何调整,因为机器学习需要庞大的数据和漫长的训练时间,单棋局的经验对它来说毫无意义。很多人以为AlphaGo能从与李世石的对决中学到很多东西,其实几盘棋根本无法对AlphaGo产生作用,它至少需要上千个棋局的数据和一个多月的时间,才能训练出新的版本出来。

AlphaGo的胜利昭示了未来几年人工智能很可能会以超出我们想象的速度发展。我们对李世石的感同身受,恐怕就是因为多少嗅到了其中危险与刺激的气息。

在那个瞬息万变的棋盘上,作为过去10年公认的全球最优秀的围棋手,李世石不仅在代表人类与机器进行一场智力上的对决,而且也在代表我们第一次“探访”一个全新的世界——一个机器智慧与人类智慧共存,甚至在某些层面超出人类控制的世界。人类曾经在小说与电影中无数次想

文档评论(0)

周澈 + 关注
实名认证
内容提供者

天堂湖

1亿VIP精品文档

相关文档