基于强化学习理论的网络拥塞控制算法研究(李鑫).pptVIP

  • 125
  • 0
  • 约4.16千字
  • 约 45页
  • 2019-07-15 发布于广东
  • 举报

基于强化学习理论的网络拥塞控制算法研究(李鑫).ppt

系统仿真 图5.1 网络性能随负载变化仿真结果 (a) 吞吐量 (b) 丢弃概率 (c) 传输时延 5 基于遗传算法的模糊Q-学习AQM控制器的设计 (a) (b) (c) 系统仿真 5 基于遗传算法的模糊Q-学习AQM控制器的设计 图5.3 本章算法缓冲队列仿真结果 图5.2 上一章算法缓冲队列仿真结果 小结 利用模糊推理实现了对连续状态空间的描述,使控制效果更加精确; 利用参数q的变化量计算适应度函数,基于遗传算法改进了动作选择策略。 5 基于遗传算法的模糊Q-学习AQM控制器的设计 6 基于价格机制的Nash Q-学习流量控制器的设计 合作用户:均分网络资源 非合作用户:竞争网络资源 图6.1 收益函数性质 (6.1) 定义第i个用户的奖赏函数为 (6.2) 为用户i以速率 发送数据所获得的收益,定义为 基于价格机制的奖赏函数设计 图6.2 价格策略函数曲线 6 基于价格机制的Nash Q-学习流量控制器的设计 控制器的设计 6 基于价格机制的Nash Q-学习流量控制器的设计 :有限的状态集,即网络的状态 的集合; :有限的动作集,即第i个用户发送速率 的集合,这里取为

文档评论(0)

1亿VIP精品文档

相关文档