- 1
- 0
- 约1.15万字
- 约 12页
- 2023-06-06 发布于四川
- 举报
本发明公开了一种基于多智能体强化学习的网内服务功能部署方法,包括以下步骤:S1、每个参与者分别更新策略π的参数;S2、每个评论家分别更新动作Q值参数;S3、定义θ={θ1,θ2,....θN}为N个agent(actor)的参数,相应的π={π1,π2,....πN}分别表示其策略;S4、对于在SFC部署过程中的用户,将第i个agent的累计预期奖励的策略梯度定义;S5、每个agent的Qi是相互独立进行训练学习的,其更新方法可以表示为:S6、定义来表示第i个agent的策略对第j个agent策
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112769594 A
(43)申请公布日 2021.05.07
(21)申请号 202011470782.7
(22)申请日 2020.12.14
(71)申请人 北京邮电大学
地址
原创力文档

文档评论(0)