- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小白的人工智能之路
AlphaGo AlphaGo Zero
在接下来的一个小时中,你将会……
认识“谁”是可爱的 AlphaGo
还有它的兄弟 AlphaGo Zero……
探知 AlphaGo 和 AlphaGo Zero的实现原理
深度神经网络……蒙特卡洛树搜索……有监督学习
做自己的井字棋 AI /人机对弈程序
易于实现的极大极小树算法
AlphaGo Human or AI?
AlphaGo 战绩
2016年1月27日
AlphaGo 以 5:0 完胜欧洲围棋冠军樊麾
2016年3月9日到15日
挑战世界围棋冠军李世石的AlphaGo 以 4:1 取得胜利
2017年5月23日到27日
乌镇围棋峰会, AlphaGo 以 3:0 战胜世界围棋冠军柯洁
AlphaGo 家族AlphaGo → AlphaGo Zero → Alpha Zero
AlphaGo:
于2014年开始由Google DeepMind开发的人工智能围棋软件。
它以人类围棋高手的棋谱作为参考数据。
AlphaGo Zero:
AlphaGo的团队于2017年10月19日在《自然》杂志上发表了一篇文章,介绍了AlphaGo Zero,这是一个没有用到人类数据的版本(围棋棋盘大小与规则除外),比以前任何击败人类的版本都要强大。
通过跟自己对战,AlphaGo Zero经过3天的学习,以100:0的成绩超越了AlphaGo Lee的实力,21天后达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。
Alpha Zero:
AlphaZero使用与AlphaGo Zero类似但更一般性的算法,在不做太多改变的前提下,并将算法从围棋延伸到将棋与国际象棋上。
AlphaGo 家族有多可怕?!
训练第 0 天的 AlphaGo Zero 什么都不懂,训练第 3 天打败 AlphaGo Lee,训练第 21 天打败 AlphaGo Master,训练第 40天超越了此前AlphaGo 系列的所有成员。
AlphaGo 家族有多可怕?!
AlphaZero在短时间训练后能达到其他算法的同等或更高水平
版本
使用规则
硬件
Elo等级分的理论峰值
战绩
AlphaGo樊 (v13)
中国规则
176个GPU,分布式
3,144
5比0战胜[???]
AlphaGo李 (v18)
48个TPU,分布式
3,739
4比1战胜[???]
AlphaGo Master
4个TPU v2,单机
4,858
网棋60比0战胜职业棋手;3比0战胜柯洁;1比0战胜人类团队
AlphaGo Zero
川普-泰勒规则
4个TPU v2,单机
5185
100:0 战胜AlphaGo李;与AlphaGo Master 对战胜率达90%
AlphaZero
4个TPU v2,单机
N/A
60:40 战胜AlphaGo Zero(3天版本)
AlphaGo 走下神坛
AlphaGo 的胜利意味着AI技术有了突破性的进展?
AlphaGo 的胜利意味着机器打败人脑?
答案是否定的。其实,AlphaGo在算法层面上并没有太多新意,而是通过 Google 强大的团队和计算平台,把已有的技术整合在一起,利用大量的训练数据和计算资源来提高准确性。
AlphaGo = 蒙特卡洛树搜索算法(MCTS) + 深度神经网络
博弈树
把游戏看作一棵树
每个结点是一种游戏状态。
名称
棋盘大小(位置数)
状态空间复杂度(状态数)
状态树复杂度(叶子结点数)
平均游戏长度
井字棋(Tic-Tac-Toe)
9
103
105
9
四子棋(Connect4)
42
1013
1021
21
翻转棋(Reversi/Othello)
64
1028
1058
58
跳棋(International draughts/Checkers)
50
1030
1054
90
中国象棋
90
1040
10150
95
国际象棋(Chess)
64
1047
10123
70
五子棋(Gomoku)
225
10105
1070
30
围棋(Go)
361
10170
10360
150
六子棋(Connect6)
361
10172
10140
30
常见对弈游戏的状态复杂度对比
围棋的状态复杂度为10170
那么10的170次方意味着什么呢?
这个规模十分可怕!
由于不能将所有状态都遍历一次,于是
AlphaGo使用“蒙特卡罗树搜索”算法(MCTS)
先从蒙特卡罗方法开始:
假设我们要计算一个不规则图形的面积。蒙特卡罗方法基于这样的思想:假想你有一袋豆子,把豆子均匀地朝这个图
您可能关注的文档
- 产后出血个案查房.ppt
- 产品部门组织构架及各岗位工作职能(精).ppt
- 产品开发解决问题5步法报告(精).ppt
- 产品生命周期理论实践与重叠需求理论实践.ppt
- 产说会操作流程.ppt
- 2018述职报告模版.ppt
- 产说会幻灯片【国寿鑫禧宝10年的期交+康悦百万医疗(A)款】.ppt
- 2018一轮复习--百家争鸣和儒家思想的形成.ppt
- 常见沟通方式.ppt
- 常见骨折的诊断与类病鉴别.ppt
- 2025年中山市沙溪镇人民政府所属事业单位招聘11人笔试备考题库及参考答案详解一套.docx
- 2025年中山市横栏镇人民政府所属事业单位第二期招聘笔试高频难、易错点备考题库及参考答案详解一套.docx
- 2025年中山市横栏镇人民政府所属事业单位第二期招聘笔试高频难、易错点备考题库含答案详解.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试高频难、易错点备考题库及完整答案详解1套.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试高频难、易错点备考题库参考答案详解.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试备考题库附答案详解.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试高频难、易错点备考题库附答案详解.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试备考题库附答案详解.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试备考题库及答案详解一套.docx
- 2025年中山市阜沙镇人民政府所属事业单位招聘笔试备考题库及完整答案详解1套.docx
文档评论(0)