一种基于深度强化学习的组播调度方法.pdfVIP

下载本文档

0
0
约4.11万字
约 26页
2023-06-23 发布于四川
举报

一种基于深度强化学习的组播调度方法.pdf

本发明公开了一种基于深度强化学习的组播调度方法，所述方法包括以下步骤：S1.构建组播网络模型并确定组播调度的目标问题；设一个小区中，用户随机请求提前缓存在基站里的N种内容，基站采用M个可用信道施行这N个内容的组播传输；考虑时隙化的模型，组播传输的开始和结束都发生在时隙的初始或结尾，而不会发生在时隙中间；S2.构建组播网络的离线学习模型；S3.进行离线训练得到成熟的模型；S4.对训练得到的模型进行在线应用，实现组播调度。本发明提供的组播调度方法，适用于带有时变约束条件和高维离散行动空间的马尔科夫决

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 CN 113490157 B (45)授权公告日 2022.02.25 (21)申请号 202110761307.3 审查员门乐 (22)申请日 2021.07.06

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种基于深度强化学习的组播调度方法.pdfVIP

一种基于深度强化学习的组播调度方法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档