- 4
- 0
- 约2.96万字
- 约 25页
- 2023-05-05 发布于四川
- 举报
本发明提供一种智能体任务学习方法及装置,该方法包括:基于自然策略梯度算法,以智能体在各历史任务下的状态信息作为样本,以智能体在各历史任务下的动作信息为样本标签,对动作预测模型的第一策略参数进行迭代更新,获取各历史任务对应的动作预测模型的最优第一策略参数;将所有历史任务对应的关键影响因子和所有历史任务对应的最优第一策略参数作为训练样本集,对任务学习模型进行迭代训练;将新任务对应的关键影响因子输入训练后的任务学习模型中,得到任务学习模型输出的新任务对应的动作预测模型的最优第二策略参数。本发明实现智能
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114298302 A
(43)申请公布日 2022.04.08
(21)申请号 202111539729.2
(22)申请日 2021.12.15
(71)申请人 中国科学院自动化研究所
您可能关注的文档
- 一种蒸烤一体机.pdf
- 一种带内置探针结构制动闸衬失效监控装置的自动扶梯.pdf
- 固定翼飞机尾流作用下箔条云可视化仿真方法.pdf
- 一种基于聚类算法的体系知识抽取方法.pdf
- 一种煤炭用带式压滤机松料装置.pdf
- 颅内血管狭窄的功能学评估方法、系统、电子设备及介质.pdf
- 一种办公人员专用健康办公座椅.pdf
- 远程内存访问方法和系统.pdf
- 用户健康情况的检测方法、装置、终端及可读存储介质.pdf
- 莠去津苯唑草酮可分散悬浮剂及其制备方法和应用.pdf
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- A Guide to Modern Econometrics 2nd Ed Marno Verbeek 习题答案.pdf VIP
- 范本道路货物运输企业车辆新增、变更、补证、注销申请表.doc VIP
- 《信息技术大数据数据资产价值评估》.pptx VIP
- 肥料级硫酸铵的作用与用途.docx VIP
- 辽西~辽中500千伏断面加强工程.pdf
- 关于几乎差集.pdf VIP
- 新零售企业数据资产评估.pptx VIP
- 变质岩 第5讲 变质岩的结构与构造.ppt VIP
- 2025年四川省什邡市事业单位公开招聘考试职业能力倾向测验(D类)(中小学教师类)真题完整版.docx VIP
- TCVIA130-2023 视觉疲劳测试与评价方法 第 3 部分 电子纸可读性测试及评价方法.pdf VIP
原创力文档

文档评论(0)