动态规划教材 .pdfVIP

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

动态规划

一、动态规划简介

动态规划是运筹学的一个分支。它是解决多阶段决策过程最优化问题的一种

方法。1951年,美国数学家贝尔曼(R.Bellman)提出了解决这类问题的“最优

化原则”,1957年发表了他的名著《动态规划》,该书是动态规划方面的第一本

著作。动态规划问世以来,在工农业生产、经济、军事、工程技术等许多方面都

得到了广泛的应用,取得了显著的效果。

动态规划运用于信息学竞赛是在90年代初期,它以独特的优点获得了出题

者的青睐。此后,它就成为了信息学竞赛中必不可少的一个重要方法,几乎在所

有的国内和国际信息学竞赛中,都至少有一道动态规划的题目。所以,掌握好动

态规划,是非常重要的。

动态规划是一种方法,是考虑问题的一种途径,而不是一种算法。因此,它

不像深度优先和广度优先那样可以提供一套模式。它必须对具体问题进行具体分

析。需要丰富的想象力和创造力去建立模型求解。

二、动态规划的几个基本概念

想要掌握好动态规划,首先要明白几个概念:阶段、状态、决策、策略、指

标函数。

1.阶段:把所给问题的过程,恰当地分为若干个相互联系的阶段,以便能按一

定的次序去求解。描述阶段的变量称为阶段变量。

2.状态:状态表示每个阶段开始所处的自然状况和客观条件,它描述了研究问

题过程中的状况,又称不可控因素。

3.决策:决策表示当过程处于某一阶段的某个状态时,可以作出不同的决定(或

选择),从而确定下一阶段的状态,这种决定称为决策,在最优控制中也称为

控制。描述决策的变量,称为决策变量。

4.策略:由所有阶段的决策组成的决策函数序列称为全过程策略,简称策略。

5.状态转移方程:状态转移方程是确定过程由一个状态到另一个状态的演变过

程。

6.指标函数:用来衡量所实现过程优劣的一种数量指标,称为指标函数。指标

函数的最优值,称为最优值函数。

三、确定动态规划的思路

1、采用动态规划来解决问题,必须符合两个重要的条件。

(1)“过去的历史只能通过当前状态去影响它未来的发展,当前的状态是对以往

历史的一个总结”,这种特性称为无后效性,是多阶段决策最优化问题的特征。

(2)作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,

对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简言之,一

个最优策略的子策略总是最优的。这就是最优化原理。

2、如果碰到一个问题,能够满足以上两个条件的话,那么就可以去进一步考虑

如何去设计使用动态规划:

(1)划分阶段。把一个问题划分成为许多阶段来思考

(2)设计合适的状态变量(用以递推的角度)

(3)建立状态转移方程(递推公式)

(4)寻找边界条件(已知的起始条件)

如果以上几个步骤都成功完成的话,我们就可以进行编程了。

四、动态规划解题的一些技巧

由于动态规划并没有一个定式,这就需要去开拓我们创造力去构造并且使用

它。以下,通过一些具体的竞赛实例谈谈使用动态规划过程中的一些技巧。

数塔问题:

有形如图1.3-8所示的数塔,从顶部出发,在每一结点可以选择向左走或是向右

走,一起走到底层,要求找出一条路径,使路径上的值最大。

9

1215

1068

21895

19710416

图1.3-8

这道题如果用枚举法,在数塔层数稍大的情况下(如40),则需要列举出的路径

条数将是一个非常庞大的数目。

如果用贪心法又往往得不到最优解。

在用动态规划考虑数塔问题时可以自顶向下的分析,自底向上的计算。从顶点出

发时到底向左走还是向右走应取决于是从左走能取到最大值还是从右走能取到

最大值,只要左右两道路径上的最大值求出来了才能作出决策。同样的道理下一

层的走向又要取决于再下一层上的最大值是否已经求出才能决策。这样一层一层

推下去,直到倒数第二层时就非常明了。如数字2,只要选择它下面较大值的结

点19前进就可以了。所以实际求解时,可从底层开始,层层递进,最后得到最

大值。

实际求解时应掌握其编程的一般规律,通常需要哪几个关键数组来存储变化过程

这一点非常重要。

数塔问题的样例程序如下:

vara:array[1.

文档评论(0)

195****9852 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档