- 18
- 0
- 约3.37千字
- 约 19页
- 2018-04-08 发布于天津
- 举报
揭秘alphago深度强化学习与蒙特卡洛搜索-集智ai学园-集智俱乐部
揭秘ALPHAGO :深度强化
学习与蒙特卡洛搜索
张江
北京师范大学系统科学学院
集智俱乐部
集智AI 学园
提纲
■ 基本概念介绍
– 深度学习
– 强化学习
■ AlphaGo
– 监督学习
– 走棋网络
– 估值网络
– 蒙特卡洛搜索
– 融合
– 表现
深度学习革命
强化学习理论
■ 没有即时反馈
■ 边做边学
– 平衡探索与利用
Arthur Samuel
典型的强化学习框架
您可能关注的文档
最近下载
- 2020年无锡市惠山区小学毕业语文期末测试卷.pdf VIP
- 手足外科编码知识点梳理.pptx VIP
- 对推进主体设计单位开展水电移民工程总承包的认识.docx VIP
- 多台矿用潜水电泵并列布置吸入条件的数值模拟分析.docx VIP
- 最新精编部编人教版小学四年级下册道德与法治全册教案 设计.doc VIP
- FANUC16i18i-MB操作说明书_部分2.pdf VIP
- 部编人教版四年级下册《道德与法治》全册教案-教学设计及教学计划.pdf VIP
- 如何分析诗句的意境.pdf VIP
- DB1303T 009-2011 酿酒葡萄营养钵快速育苗技术规程.docx VIP
- DB1303T 007-2020 星级旅游饭店服务礼仪规范.docx VIP
原创力文档

文档评论(0)