一种基于深度强化学习的组播调度方法.pdfVIP

  • 0
  • 0
  • 约4.11万字
  • 约 26页
  • 2023-06-23 发布于四川
  • 举报

一种基于深度强化学习的组播调度方法.pdf

本发明公开了一种基于深度强化学习的组播调度方法,所述方法包括以下步骤:S1.构建组播网络模型并确定组播调度的目标问题;设一个小区中,用户随机请求提前缓存在基站里的N种内容,基站采用M个可用信道施行这N个内容的组播传输;考虑时隙化的模型,组播传输的开始和结束都发生在时隙的初始或结尾,而不会发生在时隙中间;S2.构建组播网络的离线学习模型;S3.进行离线训练得到成熟的模型;S4.对训练得到的模型进行在线应用,实现组播调度。本发明提供的组播调度方法,适用于带有时变约束条件和高维离散行动空间的马尔科夫决

(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 CN 113490157 B (45)授权公告日 2022.02.25 (21)申请号 202110761307.3 审查员 门乐 (22)申请日 2021.07.06

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档