人类的最艰难一战AlphaGo:谜一样的第37手.docVIP

人类的最艰难一战AlphaGo:谜一样的第37手.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人类的最艰难一战AlphaGo:谜一样的第37手.doc

人类的最艰难一战AlphaGo:谜一样的第37手   2016年12月,美国著名的科普网站,科学新闻(ScienceNew.org)在评选十大新闻中,名列第一的是“AlphaGo战胜李世石”。   “AlphaGo在克服复杂问题上爬过了一座陡峭的山峰,在最复杂的智力游戏中战胜了人类”,在回顾中,科学新闻评价道,“现实世界的复杂程度远超这些游戏,但AlphaGo的进步让大家看到了电脑解决复杂问题的曙光。”   是的,由于AlphaGo的出现,人类作为一个整体应该意识到,世界不一样了,另一种文明,已经崭露头角。 “我代表人类”   时间倒回到2016年3月10日,首尔光化门的四季酒店,这里正在进行围棋“人机大战”第二局。在9日进行的第一局比赛中,谷歌的程序AlphaGo击败了李世石,取得了历史性的突破。在第二局的比赛中,AlphaGo下出的第37手,一个简单的肩冲,又让李世石进入了难局。   观战室里还有一名职业围棋选手,他是三届欧洲围棋冠军樊麾(Fan Hui)。一开始,第37手也令他感到困惑。但他和AlphaGo很熟悉,有五个月时间,樊麾与这台机器进行过成百上千局对弈。樊麾经常输给AlphaGo,但他也渐渐比任何人都明白它。在樊麾眼里,那一步肩冲不像是人类会下的一步棋。思索了十秒后,樊麾才恍然大悟。“这步太漂亮了,”他又重复了一遍,“太漂亮了。”   日后这一手不断被职业棋手所模仿,包括世界排名第一的柯洁,棋迷们也将这手称为“阿狗流”,与围棋战法中著名的“秀策流”、“中国流”并列。在李世石眼中,37手的阿狗流,表现出了围棋棋手所说的“直觉”――一种让它能以像人类一样的方式,甚至超越人类的方式下出优美棋局的能力。   在决定与谷歌的AlphaGo对决前,李世石对他的对手几乎一无所知,虽然AlphaGo已经以5:0战胜了欧洲冠军樊麾,但五盘棋谱尚未公布,李世石并不知道AlphaGo有多厉害,甚至没过问奖金一事。直到签完保密合同后才知道,奖金为100万美元。李世石说,“这个比赛本身的意义,比奖金大得多。这是因为,我代表人类同计算机对战。”   人类的代表李世石,在第37手面前陷入沉默。一分钟过去,又一分钟过去――整整15分钟过去了,最终,李世石拿起了一枚棋子放在了棋盘上,在对方肩冲的黑子上贴了一手,事后证明,这一手是本局的败招,4小时20分钟后,李世石选择认输。 第一滴血   谷歌虽然是一个美国公司,但AlphaGo的创造者是两个英国人,大卫?席尔瓦(David Silver)和戴米斯?哈萨比斯(Demis Hassabis),他们是剑桥同学,专业都是计算神经科学。1998年毕业后,两人合开了一家电子游戏公司。   哈萨比斯经常和一名同事下围棋,席尔瓦在他的影响下也开始自学围棋。他们还加入了当地围棋俱乐部,和二三段棋手对弈,这是围棋中非常低的水平,两个高智商的家伙并不满足于此。他们忍不住思考,为什么电脑可以打败西洋跳棋、国际象棋的选手,却从未破解围棋。   对人工智能来说,围棋游戏的难度在于,决策空间实在太大。决策(Decision Making) 是人工智能的关键要素,使得机器能够在人类的世界中发挥作用。在围棋以及任何游戏中,一次决策往往使得游戏更新到一个新局面,于是影响到接下来的决策,一直影响到最终游戏的胜负。人工智能的关键就是在决策空间中搜索达到最大效益的路径,最终体现在当前决策中。围棋棋盘上棋子可能的组合方式的数量就有10的170 次方之多,超过宇宙原子总数。在近乎无穷的决策空间中,去暴力搜索出当前棋盘的下一步最优定子是绝对不可能的事情。   2010年,哈萨比斯在伦敦成立了一个名为DeepMind的人工智能公司,席尔瓦随后而来,在这里他们开始了真正的人工智能之旅。这家公司之后又被谷歌公司收购,这也解决了他们的资金问题。   在伦敦国王十字车站附近的DeepMind办公室中,这支团队将3000万步人类下出的围棋步法输入到一个深度神经网络中,这个网络的硬件和软件能大致模拟人脑中的神经网。   神经网络其实很常见,Facebook用它给照片中的人脸加上标签,谷歌则用它来识别安卓手机收到的语音命令――给它输入足够的话语,它就能识别你所说的话。输入3000万步围棋步法,它就能学会下围棋。在经过五年的进化之后,AlphaGo取得了重大突破,成为第一位击败职业棋手的程序,而第一滴血,就是观战室的樊麾二段。   樊麾是西安人,职业二段,2000年移居法国,随后成为欧洲最强棋手。2015 年9 月底,樊麾第一次去Deepmind 公司参观,纯粹抱着旅游的心态。双方确定了比赛时间、比赛方式等等。樊麾发现他们对于人工智能方面可能很擅长,但对于这个比赛要怎么弄,一点经验都没有。最让他惊讶的是对方询问: “万一

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档