§6.1 一般方法
多阶段决策过程:这样一类问题,它们的活动过程可以分为若干个阶段,而且在任意一阶段i,过程在阶段i以后的行为,仅依赖于i阶段的过程状态,而与i之前过程如何达到这种状态的方式无关,这样的过程就构成一个多阶段决策过程。 ; 在多阶段决策过程的每一阶段,都可能有多种可供选择的决策,必须从中选取一种决策。
各个阶段的决策选定之后,就构成了解决这一问题的一个决策序列。
决策序列不同,所导致的问题的结果也不同。
目标:在选择的决策序列中选取一个获得问题最优解的决策序列,即最优决策序列。
;选取最优决策序列的方法:
1. 枚举法
2. 动态规划方法:
在50年代,贝尔曼(Richard Bellman)根据这类问题的多阶段决策的特性,提出了解决这类问题的“最优性原理” (Principle of Optimality) ,从而创建了最优化问题的一种新的算法设计方法——动态规划。
利用最优性原理以及所获得的递推关系式去求取最优决策序列,可以使枚举量大大下降。 ;最优性原理
过程的最优决策序列具有如下性质:无论过程的初始状态和初始决策是什么,其余的决策必须相对于初始决策所产生的状态构成一个最优决策序列。
用动态规划方法求解问题:
1. 判断对于所求
原创力文档

文档评论(0)