一种基于约束强化学习的通信感知联合优化方法及系统.pdfVIP

  • 1
  • 0
  • 约1.7万字
  • 约 16页
  • 2023-07-01 发布于四川
  • 举报

一种基于约束强化学习的通信感知联合优化方法及系统.pdf

本发明公开了一种基于约束强化学习的通信感知联合优化方法及系统,该方法包括:将通信感知系统建模为一个约束马尔可夫决策过程,并确定优化目标和约束条件;构建策略网络、值网络和拉格朗日乘子并采集样本数据;基于优化目标和约束条件,通过样本数据对策略网络、值网络和拉格朗日乘子进行更新训练;通信感知系统基于训练后的策略网络、训练后的值网络和训练后的拉格朗日乘子进行信息交互。通过使用本发明,能够在环境模型事先未知的情况下求解通信感知双功能场景下的时间分配问题。本发明作为一种基于约束强化学习的通信感知联合优化方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116367337 A (43)申请公布日 2023.06.30 (21)申请号 202310209925.6 (22)申请日 2023.03.07 (71)申请人 中山大学 地址 510275

文档评论(0)

1亿VIP精品文档

相关文档