动态规划法求解生产与存储问题.pdfVIP

  • 1
  • 0
  • 约1.69万字
  • 约 19页
  • 2026-03-13 发布于河北
  • 举报

动态规划

一•动态规划法的发展及其研究内容

动态规划是运筹学的一个分支,是求解决策过程最优的数

学方法。20世纪50年代初美国数学家R.E.BELLMAN等人

在研究多阶段决策过程的优问题时,提出了著名的最优

原理,把多阶段问题转为一系列的单阶段问题,逐个求解

创立了解决这类过程优问题的新方法一一动态规划。1957

年出版的他的名著D《ynamicProggramming》,这是该领域的

第一本著作。

动态规划问世以来,在经济管理•生产调度•工程技术

和最优控制等方面得到了广泛的应用。例如最短路线•库存

管理•资源分配•设备更新•组合•排序•装载等问题,采

用动态规划法求解比用其他方法更为简便。

二•动态规划法基本概念

一个多阶段决策过程最优问题的动态规划模型通常包

括以下几个要素:

1.阶段

阶段s(tage)是对整个过程的自然划分。通常根据时间顺

序或是空间特征来划分阶段,对于与时间,空间无关的“静

态”优问题,可以根据其自然特征,人为的赋予“时段”

概念,将静态问题动态,以便按阶段的顺序解优问题。

阶段变量一般用k=1.2n.表示。

1.状态

状态(state是我们所研究的问题(也叫系统)在过个

阶段的初始状态或客观条件。它应能描述过程的特征并且

具有无后效性,即当某阶段的状态给定时,这个阶段以后

的过程的演变与该阶段以前各阶段的状态无关。通常还要

求状态是可以直接或者是间接可以观测的。描述状态的变

量称为状态变量(StateVirable用s表示,状态变量的

取值集合称为状态集合,用S表示。变量允许取值的范围

称为允许状态集合(setofadmissblestates.用x(k表示第

k阶段的状态变量,它可以是一个数或者是一个向量。用

X(k表示第k阶段的允许状态集合。

n个阶段的决策过程有n+1个状态变量,x(n+l是x(n

的演变的结果。

根据演变过程的具体情况,状态变量可以是离散的或

是连续的。为了计算方便有时将连续变量离散,为了分

析的方便有时又将离散的变量视为连续的。

2.决策

当一个阶段的状态确定后,可以做出各种选择从而演变

到下一阶段的某个状态,这种选择手段称为决策

(decision,在最优控制问题+也称为控制(control

描述决策的变量称为决策变量(decisionvirable变

o

量允许取值的范围称为允许决策集合(setofadmissble

decisions)。用乙(*(〃))表示第k阶段处于阶段x(k)的决

策变量,它是x(k)的函数,用UJx(k))表示x(k)的允许

决策集合决策变量简称决策。人(*(%))£[Mx*))。

4.策

决策组成的系列称为策(policy)o由初始状态

xl开始的全过程的策记作《〃(式1)).

匕(丫。))={〃1(式1)),〃式以2)),八,%

文档评论(0)

1亿VIP精品文档

相关文档