4-2DP基本概念与最优化原理..pptVIP

  • 7
  • 0
  • 约3.87千字
  • 约 33页
  • 2016-12-28 发布于重庆
  • 举报
4-2 动态规划的 基本概念和模型 一、基本概念 DP中描述多段决策过程的基本概念主要有: ?阶段和阶段变量; ?状态和状态变量; ?决策、决策变量和决策序列; ?状态转移方程; ?阶段效应和目标函数等。 1. 阶段和阶段变量 一次性决策与多阶段决策 2. 状态和状态变量 状态是描述系统状况所必须的信息。一般定义为某一个阶段的初始点、初始位置或初始情况。 状态变量必须包含在给定的阶段上确定全部允许决策所需要的信息,阶段k的状态表示为xk。比如:在最短路问题中,状态就是网络中的各个节点。 3. 决策、决策变量和决策序列 决策就是决策者从本阶段出发对下一阶段状态的选择。 多段决策过程的发展是用各个阶段的状态演变来描述的。因为用状态描述的过程具有无后效性,因此在进行阶段决策时,只须根据当前的状态而无须考虑过去的历史。在阶段k如果给出了决策变量uk随状态变量 xk变化的函数,称为决策函数,表示为uk(xk)。 决策变量的允许取值范围,称为允许决策集合。允许决策集合是决策的约束条件。 uk的允许决策集合表示为Uk,uk?Uk 。 Uk要根据相应的状态可能集Xk并结合具体问题来确定。 从阶段k到阶段n依次进行的阶段决策构成的决策序列称

文档评论(0)

1亿VIP精品文档

相关文档