近似动态规划在资源配置中的应用-研究.pdfVIP

  • 10
  • 0
  • 约13.89万字
  • 约 71页
  • 2019-02-01 发布于江苏
  • 举报

近似动态规划在资源配置中的应用-研究.pdf

近似动态规划在资源配置中的应用研究 摘要 近似动态规划在资源配置中的应用研究 摘 要 大部分资源配置问题都具有离散或连续的状态和决策空间,针对中小型问题,一 般运用动态规划 (DP )、变分不等式或极大值原理求解,而对于大型资源配置问题, 不管问题有无模型都面临着 “维数灾”问题。经典DP 的运算时间随着问题规模的增 加而呈指数增长,变分不等式不能解决具有闭集约束条件的最优化问题,极大值原理 只给出了最优化的必要条件。而近似动态规划 (ADP )结合了强化学习、神经网络、 自适应评价系统以及经典DP 等基本原理求解复杂的非线性问题,通过近似计算值函 数可以有效避免“维数灾”问题,并克服了其他方法的缺陷。它采用在线和离线相结 合的模拟训练方式,能实时适应系统参数的变化,在近年来获得了广泛的研究。 本文运用ADP 为一般的高维离散型资源配置问题建立合理的数学模型,并提出 了基于模型的Actor-Critic 算法,然后结合两个具体实例验证模型的有效性及算法的 收敛性。 第一个实例是汽车租赁问题,在保持汽车持有量平稳变化的基础上,合理

文档评论(0)

1亿VIP精品文档

相关文档