第七章动态规划资料.pptVIP

  • 6
  • 0
  • 约2.4千字
  • 约 28页
  • 2017-04-24 发布于湖北
  • 举报
第七章 动态规划;§7.1 动态规划基本原理; (3)决策和策略 当各段的状态取定以后,就可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策.表示决策的变量,称为决策变量,常用uk(sk)表示第k阶段当状态为sk时的决策变量.在实际问题中,决策变量的取值往往限制在一定范围内,称此范围为允许决策集合,常用Dk(sk)表示第k阶段从状态sk出发的允许决策集合,即uk(sk)∈Dk(sk).; 一个按顺序排列的决策组成的集合称为策略.一个n阶段决策过程,从第k阶段到第n阶段的过程称为问题的一个后部子过程,或k子过程.由k子过程的每一阶段的决策按顺序排列组成的策略序列称为k子策略,记为pk,n(sk),即 pk,n(sk)={ uk(sk), uk+1(sk+1), uk+2 (sk+2),…,un(sn)}. 当k=1时,p1,n(s1)就是全过程的一个策略. 对每个实际问题,其k子过程可供选择的策略有一定范围,称为允许策略集合,记作Pk,n,使整个问题达到最优效果的策略就是最优策略.; (4)状态转移方程 动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果.如

文档评论(0)

1亿VIP精品文档

相关文档