- 0
- 0
- 约1.22万字
- 约 12页
- 2023-04-24 发布于北京
- 举报
本发明提供种基于博弈的强化学习方法、系统、终端及存储介质,包括:根据输入的博弈规则,基于行为树将学习任务分解为一组子任务;确定每个子任务对应的状态空间、动作空间和奖励函数,并构建强化学习模型;将同一组子任务的强化学习模型的参数进行共享,对所有子任务的强化学习模型进行混合训练;在满足收敛条件的情况下,输出训练的强化学习模型。本发明顶层采用基于博弈规则的行为树在不同子任务之间切换,能够有效降低复杂任务的学习难度,提高学习效率;底层采用基于多智能体的强化学习方法训练与环境交互的模型,可以有效地描述局部
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114021737 A
(43)申请公布日 2022.02.08
(21)申请号 202111302570.2 G06N 3/08 (2006.01)
(22)申请日 20
您可能关注的文档
- namenode节点的启动方法、装置、系统及介质.pdf
- 基于主成分分析和凸优化的低压配网拓扑自适应识别方法.pdf
- 一种智能飞机牵引机器人.pdf
- 一种智轨列车的站台广播控制方法、系统及相关装置.pdf
- 包括具有多个孔隙端口的联接板的枕头.pdf
- 放射源射线聚焦投射控制方法.pdf
- 一种智能柜.pdf
- 一种离线部署Kubernetes集群的方法.pdf
- 一种土地调查用快速建库方法及系统.pdf
- 一种消息处理方法、装置、设备及存储介质.pdf
- 七年级语文上册期末模拟试卷1(解析版).docx
- 七年级语文上册期末模拟试卷1(原卷版).docx
- 七年级语文上册期末模拟试卷2(原卷版).docx
- 七年级语文上册期末模拟试卷2(解析版).docx
- 期末测试卷(二)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(三)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(二)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(三)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(一)(原卷版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
- 期末测试卷(一)(解析版)2024—2025学年七年级语文上册期末测试卷(全国版).docx
原创力文档

文档评论(0)