动态规划法求解生产与存储问题.pdfVIP

下载本文档

1
0
约1.69万字
约 19页
2026-03-13 发布于河北
举报

动态规划法求解生产与存储问题.pdf

动态规划

一•动态规划法的发展及其研究内容

动态规划是运筹学的一个分支，是求解决策过程最优的数

学方法。20世纪50年代初美国数学家R.E.BELLMAN等人

在研究多阶段决策过程的优问题时，提出了著名的最优

原理，把多阶段问题转为一系列的单阶段问题，逐个求解

创立了解决这类过程优问题的新方法一一动态规划。1957

年出版的他的名著D《ynamicProggramming》，这是该领域的

第一本著作。

动态规划问世以来，在经济管理•生产调度•工程技术

和最优控制等方面得到了广泛的应用。例如最短路线•库存

管理•资源分配•设备更新•组合•排序•装载等问题，采

用动态规划法求解比用其他方法更为简便。

二•动态规划法基本概念

一个多阶段决策过程最优问题的动态规划模型通常包

括以下几个要素：

1.阶段

阶段s（tage）是对整个过程的自然划分。通常根据时间顺

序或是空间特征来划分阶段，对于与时间，空间无关的“静

态”优问题，可以根据其自然特征，人为的赋予“时段”

概念，将静态问题动态，以便按阶段的顺序解优问题。

阶段变量一般用k=1.2n.表示。

1.状态

状态(state是我们所研究的问题(也叫系统)在过个

阶段的初始状态或客观条件。它应能描述过程的特征并且

具有无后效性，即当某阶段的状态给定时，这个阶段以后

的过程的演变与该阶段以前各阶段的状态无关。通常还要

求状态是可以直接或者是间接可以观测的。描述状态的变

量称为状态变量(StateVirable用s表示，状态变量的

取值集合称为状态集合，用S表示。变量允许取值的范围

称为允许状态集合(setofadmissblestates.用x(k表示第

k阶段的状态变量，它可以是一个数或者是一个向量。用

X(k表示第k阶段的允许状态集合。

n个阶段的决策过程有n+1个状态变量,x(n+l是x(n

的演变的结果。

根据演变过程的具体情况，状态变量可以是离散的或

是连续的。为了计算方便有时将连续变量离散，为了分

析的方便有时又将离散的变量视为连续的。

2.决策

当一个阶段的状态确定后，可以做出各种选择从而演变

到下一阶段的某个状态，这种选择手段称为决策

(decision,在最优控制问题+也称为控制(control

描述决策的变量称为决策变量(decisionvirable变

量允许取值的范围称为允许决策集合(setofadmissble

decisions)。用乙(*(〃))表示第k阶段处于阶段x(k)的决

策变量，它是x(k)的函数，用UJx(k))表示x(k)的允许

决策集合决策变量简称决策。人(*(%))£[Mx*))。

4.策

决策组成的系列称为策(policy)o由初始状态

xl开始的全过程的策记作《〃(式1)).

匕(丫。))={〃1(式1)),〃式以2)),八,%

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

动态规划法求解生产与存储问题.pdfVIP