AlphaGo小白的人工智能之路.pptVIP

下载本文档

21
0
约4.69千字
约 40页
2019-02-16 发布于江西
举报
版权申诉

AlphaGo小白的人工智能之路.ppt

1、本文档共40页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

小白的人工智能之路 AlphaGo AlphaGo Zero 在接下来的一个小时中，你将会…… 认识“谁”是可爱的 AlphaGo 还有它的兄弟 AlphaGo Zero…… 探知 AlphaGo 和 AlphaGo Zero的实现原理深度神经网络……蒙特卡洛树搜索……有监督学习做自己的井字棋 AI /人机对弈程序易于实现的极大极小树算法 AlphaGo Human or AI？ AlphaGo 战绩 2016年1月27日 AlphaGo 以 5:0 完胜欧洲围棋冠军樊麾 2016年3月9日到15日挑战世界围棋冠军李世石的AlphaGo 以 4:1 取得胜利 2017年5月23日到27日乌镇围棋峰会， AlphaGo 以 3:0 战胜世界围棋冠军柯洁 AlphaGo 家族AlphaGo → AlphaGo Zero → Alpha Zero AlphaGo: 于2014年开始由Google DeepMind开发的人工智能围棋软件。它以人类围棋高手的棋谱作为参考数据。 AlphaGo Zero: AlphaGo的团队于2017年10月19日在《自然》杂志上发表了一篇文章，介绍了AlphaGo Zero，这是一个没有用到人类数据的版本（围棋棋盘大小与规则除外），比以前任何击败人类的版本都要强大。通过跟自己对战，AlphaGo Zero经过3天的学习，以100:0的成绩超越了AlphaGo Lee的实力，21天后达到了AlphaGo Master的水平，并在40天内超过了所有之前的版本。 Alpha Zero: AlphaZero使用与AlphaGo Zero类似但更一般性的算法，在不做太多改变的前提下，并将算法从围棋延伸到将棋与国际象棋上。 AlphaGo 家族有多可怕？！训练第 0 天的 AlphaGo Zero 什么都不懂，训练第 3 天打败 AlphaGo Lee，训练第 21 天打败 AlphaGo Master，训练第 40天超越了此前AlphaGo 系列的所有成员。 AlphaGo 家族有多可怕？！ AlphaZero在短时间训练后能达到其他算法的同等或更高水平版本使用规则硬件 Elo等级分的理论峰值战绩 AlphaGo樊 (v13) 中国规则 176个GPU，分布式 3,144 5比0战胜[???] AlphaGo李 (v18) 48个TPU，分布式 3,739 4比1战胜[???] AlphaGo Master 4个TPU v2，单机 4,858 网棋60比0战胜职业棋手；3比0战胜柯洁；1比0战胜人类团队 AlphaGo Zero 川普-泰勒规则 4个TPU v2，单机 5185 100:0 战胜AlphaGo李;与AlphaGo Master 对战胜率达90% AlphaZero 4个TPU v2，单机 N/A 60:40 战胜AlphaGo Zero（3天版本） AlphaGo 走下神坛 AlphaGo 的胜利意味着AI技术有了突破性的进展？ AlphaGo 的胜利意味着机器打败人脑？答案是否定的。其实，AlphaGo在算法层面上并没有太多新意，而是通过 Google 强大的团队和计算平台，把已有的技术整合在一起，利用大量的训练数据和计算资源来提高准确性。 AlphaGo = 蒙特卡洛树搜索算法(MCTS) + 深度神经网络博弈树把游戏看作一棵树每个结点是一种游戏状态。名称棋盘大小(位置数) 状态空间复杂度(状态数) 状态树复杂度(叶子结点数) 平均游戏长度井字棋(Tic-Tac-Toe) 9 103 105 9 四子棋(Connect4) 42 1013 1021 21 翻转棋(Reversi/Othello) 64 1028 1058 58 跳棋(International draughts/Checkers) 50 1030 1054 90 中国象棋 90 1040 10150 95 国际象棋(Chess) 64 1047 10123 70 五子棋(Gomoku) 225 10105 1070 30 围棋(Go) 361 10170 10360 150 六子棋(Connect6) 361 10172 10140 30 常见对弈游戏的状态复杂度对比围棋的状态复杂度为10170 那么10的170次方意味着什么呢？这个规模十分可怕！由于不能将所有状态都遍历一次，于是 AlphaGo使用“蒙特卡罗树搜索”算法(MCTS) 先从蒙特卡罗方法开始：假设我们要计算一个不规则图形的面积。蒙特卡罗方法基于这样的思想：假想你有一袋豆子，把豆子均匀地朝这个图