dp00.pptVIP

  • 6
  • 0
  • 约5.04千字
  • 约 5页
  • 2016-11-14 发布于山西
  • 举报
dp00

DPによる最短路解法 動的計画法で最短路問題を解く 最適性原理に基づいて時間ごとの最適政策を求める方法を、動的計画法(Dynamic Programming; DP)という。 ベルマンの最適性原理とは、直観的に言えば全体の問題の最適解の部分解は部分問題の最適解に一致するということであるが、厳密には次の再帰方程式によって定式化される。 ベルマンの再帰方程式 目的関数を f とする。有限期の場合、最終期Tとすると、1≦t≦Tに対して任意の t 期以降の部分問題を考えることができる。第 t 期の状態をs(t)とし、以降の部分問題の目的関数の最適値を f[s(t) ]と書く。 またc[s‘(t)、s(t)]をs(t)から状態s(t+1)=s’(t)に移るための遷移費用とする。このとき最適政策は次のような再帰的条件によって表される。  f[s(t) ]   = Mins(k+1) (c[s(k+1),s(k)]+f[s(k+1) ])、1≦k≦T、ただしc[s(T+1),s(T)]=0とする。  すなわち遷移費用と後継状態以降の最適政策が分かっていれば、 t期以降の最適政策が計算できる。全体のfはf(s(0))に等しい。 後方帰納 図の最短路問題のように有限期の場合は、後方帰納(Backwad Induction)と呼ばれる推論を使えば最適政策が求まる。 任意のノードnから6までの最短ツ

文档评论(0)

1亿VIP精品文档

相关文档