dp00.pptVIP

下载本文档

6
0
约5.04千字
约 5页
2016-11-14 发布于山西
举报

dp00.ppt

dp00

ＤＰによる最短路解法動的計画法で最短路問題を解く最適性原理に基づいて時間ごとの最適政策を求める方法を、動的計画法（Dynamic Programming； DP)という。ベルマンの最適性原理とは、直観的に言えば全体の問題の最適解の部分解は部分問題の最適解に一致するということであるが、厳密には次の再帰方程式によって定式化される。ベルマンの再帰方程式目的関数をｆとする。有限期の場合、最終期Ｔとすると、１≦ｔ≦Tに対して任意のｔ期以降の部分問題を考えることができる。第ｔ期の状態をｓ（ｔ）とし、以降の部分問題の目的関数の最適値をｆ［ｓ（ｔ）］と書く。またｃ［ｓ‘（ｔ）、ｓ（ｔ）］をｓ（ｔ）から状態ｓ（ｔ＋１）＝ｓ’（ｔ）に移るための遷移費用とする。このとき最適政策は次のような再帰的条件によって表される。　ｆ［ｓ（ｔ）］　　＝　Minｓ（ｋ＋１）（ｃ［ｓ（ｋ＋１），ｓ（ｋ）］＋ｆ［ｓ（ｋ＋１）］）、１≦ｋ≦Ｔ、ただしｃ［ｓ（Ｔ＋１），ｓ（Ｔ）］＝０とする。　すなわち遷移費用と後継状態以降の最適政策が分かっていれば、ｔ期以降の最適政策が計算できる。全体のｆはｆ（ｓ（０））に等しい。後方帰納図の最短路問題のように有限期の場合は、後方帰納（Backwad Induction）と呼ばれる推論を使えば最適政策が求まる。任意のノードｎから６までの最短ツ

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

dp00.pptVIP

dp00.ppt

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档