人机大战后，人工智能会走多远.docVIP

下载本文档

10
0
约 7页
2016-09-24 发布于北京
举报
版权申诉

人机大战后，人工智能会走多远.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

人机大战后，人工智能会走多远.doc

人机大战后，人工智能会走多远　　在一场令世人瞩目的人机围棋大战后，AlphaGo以胜利者的姿态告诉人们，人工智能真的来了，它不再只是电影中的场景，而是现实世界里正在上演的又一轮产业变革。与此同时，有专家担忧人工智能将超越人类智能的潜力和控制，迅速改变人类文明。　　前不久，一场围棋大战吸引了全世界的目光。这场大战在韩国首尔上演，共5轮。大战之所以举世瞩目，是因为对战的双方是韩国九段棋手李世石与围棋人工智能程序AlphaGo。令人惊叹的是，整个比赛过程中，AlphaGo的表现都堪称完美，最终以4：1击败李世石。　　这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣？它为什么如此厉害？人工智能对人类来说到底意味着什么？从“深蓝”到AlphaGo 　　人工智能是计算机科学的一个分支，它企图了解人类智能的实质，并生产出一种新的、能以与人类智能相似的方式做出反应的智能机器。人工智能是对人的意识、思维的信息过程的模拟，使得机器能像人那样思考，甚至超过人的智能。自1956年这个概念被提出并确立以来，该领域就被视为人类最高的梦想之一。　　1997年，IBM的超级计算机“深蓝”以2胜1负3平的成绩战胜了当时世界排名第一的国际象棋大师加里?卡斯帕罗夫，一时间全球轰动，而“深蓝”的设计者们当时就畅想：何时计算机也能下围棋呢？　　而现在无疑又是一个人工智能历史上最重要的时刻。围棋和国际象棋在复杂程度上不属于一个量级，围棋是一种变数极多、充满不确定的竞技，每一步棋的可能性都是一个几乎无法穷尽的量级，一回合有250种可能，而一盘棋可以多达150回合。　　此外，下围棋的过程中还会出现“吃子”情况，加剧了其复杂性。曾任职谷歌公司的李开复说，当年“深蓝”与卡斯帕罗夫的对局，实际上使用的是人工调整的评估函数，并用特殊设计的硬件和“暴力”的搜索征服了国际象棋级别的复杂度，围棋则不行。“因为它的搜索太广，每一步的选择有几百而非几十；也太深，一盘棋有几百步而非几十步。”李开复在知乎上如此回答。　　此外，围棋问题与现实生活中的问题相通，国人甚至将下围棋视为洞悉人性、参悟人生的过程。然而，现在下围棋的却是一个机器，意味着这个机器除了拥有超强的记忆能力、逻辑思维能力，还要拥有创造力甚至个性。　　“感觉就像一个有血有肉的人在下棋一样，该弃的地方会弃，该退出的地方退出，非常均衡的一个棋风，真是看不出出自程序之手。”围棋排名世界第一的柯洁说，AlphaGo有好几次落子极其“非常规”，许多专业棋手都表示看不懂。而“棋圣”聂卫平甚至表示自己想要对AlphaGo的“惊人一手”脱帽致敬，因为它“用不可思议的下法辟立了围棋常识之外的新天地”。也就是说，这不是AlphaGo从既往棋局中复制过来的，而是自己创造的战术打法。人工智能进入实用阶段　　实际上，AlphaGo是通过蒙特卡洛树搜索算法和两个深度神经网络合作来完成下棋。在与李世石对阵之前，谷歌首先用人类对弈的近3000万种走法来训练AlphaGo的神经网络，让它学会预测人类专业棋手怎么落子。然后更进一步，让AlphaGo自己跟自己下棋，从而又产生规模庞大的全新棋谱。谷歌工程师曾宣称AlphaGo每天可以尝试百万量级的走法。　　“它们的任务在于合作‘挑选’出那些比较有前途的棋步，抛弃明显的差棋，从而将计算量控制在计算机可以完成的范围内。在本质上，这和人类棋手所做的一样。”中科院自动化研究所博士研究生刘加奇说。　　“传统的棋类软件一般采用暴力搜索，包括深蓝计算机，它是对所有可能结果建立搜索树，根据需要进行遍历搜索。这种方法在国际象棋、跳棋等方面还具有一定可实现性，但对于围棋就无法实现。”中科院自动化研究所研究员易建强说，“ AlphaGo利用深度学习的方法降低了搜索树的复杂性，搜索空间得到有效降低。比如，策略网络负责指挥计算机搜索出更像人类高手该落子的位置，而估值网络负责指挥计算机搜索出后续更有可能获胜的一个落子位置。” 　　刘加奇进一步解释，深度神经网络最基础的一个单元就类似人类大脑的神经元，很多层连接起来就好比是人类大脑的神经网络。AlphaGo的两个神经网络“大脑”分别是策略网络和估值网络。　　“策略网络主要用来生成落子策略。在下棋的过程中，它不是考虑自己应该怎么下，而是想人类的高手会怎么下。也就是说，它会根据输入棋盘当前的一个状态，预测人类下一步棋会下在哪里，提出最符合人类思维的几种可行的下法。” 　　然而，策略网络并不知道自己要下出的这步棋到底下得好还是不好，它只知道这步棋是否跟人类下的一样，这时就需要估值网络来发挥作用。　　刘加奇说：“估值网络会为各个可行的下法评估整个盘面的情况，然后给出一个胜率。这些值会反馈到蒙特卡洛树搜索算法中，通过反复如上过程推演出