网站大量收购独家精品文档,联系QQ:2885784924

第五组-终身学习.pptxVIP

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

汇报成员:高玉箫、李书豪、蔡佳豪、杜博轩、陈凯悦、李松

指导教师:张华平

汇报时间:2020.11.5;1;1;终身半监督学习;监督和无监督学习;终身半监督学习;迁移学习;终身半监督学习;终身半监督学习案例-NELL;2;NELL介绍;;NELL结构;NELL子组件;NELL子组件;NELL子组件;NELL子组件;NELL子组件;NELL总结;3;NEIL简介;NEIL的主要贡献;可视化实例;实体关系;模型流程结构;实验结果;4;典型实例;强化学习;强化学习中没有输入/输出对

监督学习中,手动标签指示输入的最佳输出标签。

强化学习中,在采取行动后,不会告知代理人哪个行动符合其最佳长期利益。

因此,智能体需要获得有用的经验,并通过与反馈的环境互动来学习最佳的行动顺序。;终身强化学习;终身强化学习发展现状;发展概况;发展概况;发展概况;5;LifelongRLvsMulti-TaskRL;Multi-TaskHierarchicalBayesianRL;Multi-TaskHierarchicalBayesianRL;PG-ELLA基于策略梯度有效的终身强化学习方法;基于策略梯度有效的终身强化学习方法PG-ELLA;基于策略梯度有效的终身强化学习方法PG-ELLA;基于策略梯度有效的终身强化学习方法PG-ELLA;OtherHierarchicalLRL;LifelonglearningwithhierarchicalDRL;LifelonglearningwithhierarchicalDRL;游戏实验;6;动机:如何使机器人在工作中学习?;fine-tuningmethod

Pre-Train:源条件(基础物品集,608000次抓取)

Explore:新条件(抓取没见过的透明瓶,800次抓取)

Initialize:基础模型(预训练模型)+训练数据

(各以50%的概率抓取源条件和新条件)

Adapt:再次训练

Evaluate:在新条件下抓取;单步“微调”方法的实验效果;6;6;6;现实世界:持续变化

机器人:背景、光照、臂长、抓取器位置、未知物体;单步微调和持续微调的对比;机器人可以快速适应新的环境

时间?

算法也很简单,重用数据和模型

可持续学习,效果也很好;终身学习总结与展望;现在有大量可用的数据,这使系统能够学习大量的各种知识。

统计机器学习正在变得成熟。进一步的改进变得越来越困难,而使用过去所学的知识来帮助学习是一种自然的前进方式,它模仿了人类的学习过程。现有研究表明,LML非常有效。

随着在现实环境中与人和其他??统交互的智能个人助理,聊天机器人和物理机器人的使用,连续LML功能变得越来越必要。;终身学习总结与展望

文档评论(0)

说明书库 + 关注
实名认证
文档贡献者

24小时提供说明书查找服务。

1亿VIP精品文档

相关文档