动态规划(Dynamic Programming);A;引例2:投资金额分配问题;状态
(未分的资金额);2.对于项目B;状态
(未分的资金额); 包含随时间变化的因素和变量的系统。;每个阶段都要进行决策,目的是使整个过程的决策 达到最优效果。;多阶段决策问题的典型例子: ; 但要便于把问题的过程能转化为多阶段决策 的过程。; 在实际问题中决策变量的取值往往在某一范围之内,此范围称为允许决策集合。常用Dk(sk)表示第k阶段从状态sk出发的允许决策集合,显然有 ; 系统在某一阶段的状态转移不但与系统的当前的状态和决策有关,而且还与系统过去的历史状态和决策有关。其状态转移方程如下(一般形式);1; 如果状态变量不能满足无后效性的要求,应适当地改变状态的定义或规定方法。; 由每段的决策按顺序排列组成的决策函数序列称为k子过程策略,; 它是定义在全过程或所有后部子过程上确定的数量函数。;常见的指标函数的形式是:;过程和它的任意子过程的指标是它所包含的各阶段的指标的 乘 积。即
; 多阶段决策过程的数学模型:(具有无后效性的多阶段决策过
原创力文档

文档评论(0)