- 2
- 0
- 约6.95千字
- 约 37页
- 2017-07-07 发布于湖北
- 举报
④就下棋而言,一种直观的思路就是列举所有能赢的方案,然后优选出一个最佳方案。一般来说,下一盘围棋大约需要150步,每一步有250种可选的方法,要是人工智能采用这种思路,需要计算大约10360种情况。这样看来,在有时限要求的比赛中,列举所有情况的思路是不可行的,所以,研究者们选择了模仿人类大师的下棋方式,这就是“深度学习”。其原理是通过两种不同的深度神经网络——“策略网络”和“价值网络”合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围内。其中,“策略网络”负责减少搜索的宽度。面对眼前的一盘棋,人工智能机器人会观察棋盘布局并试图找到最佳的下一步,相当于“落子选择器”。而“价值网络”则负责减少搜索的深度。人工智能机器人会评估棋局的整体局面并预测双方 胜负,相当于“棋局评估器”,在局面处于明显劣势的时候,会直接抛弃某些线路,从而辅助落子选择器。在“两个大脑”的配合下,“阿尔法围棋”具有了像人类棋手那样的思维方式。同时,研究者通过“监督学习”让机器人掌握海量的专业棋局;通过“强化学习”让机器人从每次对弈中获得新的经验。而且,一个人或许一年能玩1000局,但机器人一天就能玩100万局;人类在长时间比赛时会犯错,但机器不会。所以,从理论上说,“阿尔法围棋”只要经过足够的训练,就能击败所有人类选手。 * 语文 浙江专用 说明文阅读(一) 对象、特征
原创力文档

文档评论(0)