人类的最艰难一战AlphaGo：谜一样的第37手.docVIP

下载本文档

74
0
约2.5千字
约 4页
2017-03-30 发布于北京
举报
版权申诉

人类的最艰难一战AlphaGo：谜一样的第37手.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

人类的最艰难一战AlphaGo：谜一样的第37手.doc

人类的最艰难一战AlphaGo：谜一样的第37手　　2016年12月，美国著名的科普网站，科学新闻（ScienceNew.org）在评选十大新闻中，名列第一的是“AlphaGo战胜李世石”。　　“AlphaGo在克服复杂问题上爬过了一座陡峭的山峰，在最复杂的智力游戏中战胜了人类”，在回顾中，科学新闻评价道，“现实世界的复杂程度远超这些游戏，但AlphaGo的进步让大家看到了电脑解决复杂问题的曙光。” 　　是的，由于AlphaGo的出现，人类作为一个整体应该意识到，世界不一样了，另一种文明，已经崭露头角。 “我代表人类” 　　时间倒回到2016年3月10日，首尔光化门的四季酒店，这里正在进行围棋“人机大战”第二局。在9日进行的第一局比赛中，谷歌的程序AlphaGo击败了李世石，取得了历史性的突破。在第二局的比赛中，AlphaGo下出的第37手，一个简单的肩冲，又让李世石进入了难局。　　观战室里还有一名职业围棋选手，他是三届欧洲围棋冠军樊麾（Fan Hui）。一开始，第37手也令他感到困惑。但他和AlphaGo很熟悉，有五个月时间，樊麾与这台机器进行过成百上千局对弈。樊麾经常输给AlphaGo，但他也渐渐比任何人都明白它。在樊麾眼里，那一步肩冲不像是人类会下的一步棋。思索了十秒后，樊麾才恍然大悟。“这步太漂亮了，”他又重复了一遍，“太漂亮了。” 　　日后这一手不断被职业棋手所模仿，包括世界排名第一的柯洁，棋迷们也将这手称为“阿狗流”，与围棋战法中著名的“秀策流”、“中国流”并列。在李世石眼中，37手的阿狗流，表现出了围棋棋手所说的“直觉”――一种让它能以像人类一样的方式，甚至超越人类的方式下出优美棋局的能力。　　在决定与谷歌的AlphaGo对决前，李世石对他的对手几乎一无所知，虽然AlphaGo已经以5：0战胜了欧洲冠军樊麾，但五盘棋谱尚未公布，李世石并不知道AlphaGo有多厉害，甚至没过问奖金一事。直到签完保密合同后才知道，奖金为100万美元。李世石说，“这个比赛本身的意义，比奖金大得多。这是因为，我代表人类同计算机对战。” 　　人类的代表李世石，在第37手面前陷入沉默。一分钟过去，又一分钟过去――整整15分钟过去了，最终，李世石拿起了一枚棋子放在了棋盘上，在对方肩冲的黑子上贴了一手，事后证明，这一手是本局的败招，4小时20分钟后，李世石选择认输。第一滴血　　谷歌虽然是一个美国公司，但AlphaGo的创造者是两个英国人，大卫?席尔瓦（David Silver）和戴米斯?哈萨比斯（Demis Hassabis），他们是剑桥同学，专业都是计算神经科学。1998年毕业后，两人合开了一家电子游戏公司。　　哈萨比斯经常和一名同事下围棋，席尔瓦在他的影响下也开始自学围棋。他们还加入了当地围棋俱乐部，和二三段棋手对弈，这是围棋中非常低的水平，两个高智商的家伙并不满足于此。他们忍不住思考，为什么电脑可以打败西洋跳棋、国际象棋的选手，却从未破解围棋。　　对人工智能来说，围棋游戏的难度在于，决策空间实在太大。决策（Decision Making）是人工智能的关键要素，使得机器能够在人类的世界中发挥作用。在围棋以及任何游戏中，一次决策往往使得游戏更新到一个新局面，于是影响到接下来的决策，一直影响到最终游戏的胜负。人工智能的关键就是在决策空间中搜索达到最大效益的路径，最终体现在当前决策中。围棋棋盘上棋子可能的组合方式的数量就有10的170 次方之多，超过宇宙原子总数。在近乎无穷的决策空间中，去暴力搜索出当前棋盘的下一步最优定子是绝对不可能的事情。　　2010年，哈萨比斯在伦敦成立了一个名为DeepMind的人工智能公司，席尔瓦随后而来，在这里他们开始了真正的人工智能之旅。这家公司之后又被谷歌公司收购，这也解决了他们的资金问题。　　在伦敦国王十字车站附近的DeepMind办公室中，这支团队将3000万步人类下出的围棋步法输入到一个深度神经网络中，这个网络的硬件和软件能大致模拟人脑中的神经网。　　神经网络其实很常见，Facebook用它给照片中的人脸加上标签，谷歌则用它来识别安卓手机收到的语音命令――给它输入足够的话语，它就能识别你所说的话。输入3000万步围棋步法，它就能学会下围棋。在经过五年的进化之后，AlphaGo取得了重大突破，成为第一位击败职业棋手的程序，而第一滴血，就是观战室的樊麾二段。　　樊麾是西安人，职业二段，2000年移居法国，随后成为欧洲最强棋手。2015 年9 月底，樊麾第一次去Deepmind 公司参观，纯粹抱着旅游的心态。双方确定了比赛时间、比赛方式等等。樊麾发现他们对于人工智能方面可能很擅长，但对于这个比赛要怎么弄，一点经验都没有。最让他惊讶的是对方询问： “万一