- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 8.2 动态规划的基本原理 动态规划的目标 有多个方案,且每个方案都有一个总指标函数值 动态规划的目标是找到最优的方案,也就是找到使得总指标函数最优(最大或最小)方案,即 在总指标函数中,一般来说s1是给定的,其它的变量都是不确定的,这样一来总指标函数有2n-1个变量,直接求极值非常困难。动态规划的最优化原理提供了另外一种求解思路。 最优化原理的语言描述 一个过程的最优策略具有这样的性质,即无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策必构成最优策略。 理解1:如果第一阶段到第k阶段形成的策略是最优策略的话,那么从第一阶段到第t阶段所形成的策略也必须是最优策略(tk) 例如在一个图中,若从点1到点5的最短路线为 1→2→3 →5 则1→2→3 是点1到点3的最短路线, 1→2是点1到点2的最短路线 最优化原理的语言描述 一个过程的最优策略具有这样的性质,即无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策必构成最优策略。 理解2:如果第k阶段到第n阶段形成的策略是最优策略的话,那么从第t阶段到第n阶段所形成的策略也必须是最优策略(tk) 例如在一个图中,若从点1到点5的最短路线为 1→2→3 →5 则2→3→5 是点2到点5的最短路线,3→5是点3到点5的最短路线 1. 利用前部子指标函数来描述 由于opt{V1,t+1}仅仅与状态st+1有关,因而也称opt{V1,t+1}为前部最优值函数,用ft{st+1}来表示,则上式可表示为 最优化原理的数学描述——和形式 为了递推方程形式的统一,可以引入f0(s1)=0, 这样一来上面的递推公式就可写为下式 由于f0(s1)=0是专门引入的,特称之为边界条件 最优化原理的数学描述——和形式 2. 利用后部子指标函数 由于opt{Vt,n+1}仅仅与状态st有关,因而也称opt{Vt,n+1}为后部最优值函数,用ft{st}来表示,则上式可表示为 最优化原理的数学描述——和形式 为了递推方程形式的统一,可以引入fn+1(sn+1)=0, 这样一来上面的递推公式就可写为下式 由于fn+1(sn+1)=0是专门引入的,也称之为边界条件 最优化原理的数学描述——和形式 由于最优值指标函数fk(sk+1)中与状态变量st (1≤t ≤ k)和决策变量ut (1≤t ≤ k)无关,这意味着以前的状态和决策不影响后面的优化过程, 也就是fk+1(sk+2)仅仅与fk(sk+1) 有关,把这种特性称之为无后效性。 动态规划的无后效性 1. 基于前部最优值指标函数递推方程 由于最优值指标函数fk(sk)中与状态变量st+1(k≤t ≤n)和决策变量ut (k ≤t ≤n)无关,这意味着以前的状态和决策 不影响以后的优化过程,也就是fk-1(sk-1)仅仅与fk(sk) 有关,把这种特性称之为无后效性。 2. 基于后部最优值指标函数递推方程 1. 利用前部子指标函数来描述 最优化原理的数学描述——积形式 其中f0(s1)=1为引入的边界条件 2. 利用后部子指标函数 最优化原理的数学描述——积形式 其中fn+1(sn+1)=1是引入的边界条件 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 最短路的这个特点是如何找到的呢?就是把动态规划最优化原理用于最短路问题时一种具体的描述 动态规划方法就是根据最优化 原理,建立问题的递推公式从而得到最优解 *
原创力文档


文档评论(0)