- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 动态规划
第六章 动态规划
数据、模型与决策 (第二版)
工商管理硕士(MBA)系列教材
《数据、模型与决策》相关教学课件
免财富值!!
学习目标
动态规划是解决多阶段决策过程最优化问题的一种方法。
明确什么是多阶段的决策问题;理解动态规划的基本思想和基本方程;理解动态规划的最优性原理和最优性定理。
掌握动态规划在资源分配问题、生产和存贮问题、采购问题中的应用,并学会使用动态规划方法分析和解决实际的问题。
第六章 动态规划
数据、模型与决策 (第二版)
第六章 动态规划
动态规划(Dynamic Programming,简称DP)是运筹学的重要分支之一,它是一种研究多阶段决策问题的最优化理论和方法。大约产生于50年代。1951年美国数学家贝尔曼(R.Bellman)等人,根据一类多阶段决策问题的特点,把多阶段决策问题变为一系列互相联系单阶段问题,然后逐个加以解决。
动态规划的方法,在工程技术中、企业管理、工农业生产及军事等部门都有广泛的应用,并且获得了显著的效果。
动态规划模型的分类,根据多阶段决策过程的时间变量是离散的还是连续的变量,过程分为离散决策过程和连续决策过程。
第六章 动态规划
数据、模型与决策 (第二版)
第六章 动态规划
6.1 动态规划的基本概念和基本方程
6.2 动态规划应用举例
第六章 动态规划
数据、模型与决策 (第二版)
6.1 动态规划的基本概念和基本方程
6.1.1 多阶段决策
6.1.2 动态规划的基本概念
6.1.3 动态规划的基本方程
6.1.4 动态规划的基本思想归纳
6.1.5 动态规划的最优性原理和最优性定理
第六章 动态规划
数据、模型与决策 (第二版)
6.1.1 多阶段决策
多阶段决策问题:把一个问题可看作一个前后关联具有链状结构的多阶段过程就称为多阶段决策过程,也称序贯决策过程。
第六章 动态规划
数据、模型与决策 (第二版)
最短路问题
下图是一个线路网络图,代表待定的输油管可行路线,A,B,C代表经过的三个地区,每个地区都有若干个转运点,构成许多不同的输油路线,转运点间的数字表示点间距离,问应选择那些路线,使总路线最短?
第六章 动态规划
数据、模型与决策 (第二版)
6.1.2 动态规划的基本概念
阶段
状态
决策
策略
状态转移方程
指标函数和最优值函数
第六章 动态规划
数据、模型与决策 (第二版)
6.1.3动态规划的基本方程
动态规划的方法是从终点逐段向始点方向寻找最短路线的一种方法。
当k=4时,由D1到终点E只有一条路线,故f4(D1)=4, 同理,f4(D2)=3。
当k=3时,出发点有C1,C2 ,C3三个。若从C1出发,则有两个选择,一是至D1,一是至D2,则
f3(C1)=min =min =7
其相应的决策为u3(C1)= D1,这说明,由C1至终点E的最短距离为7,其最短路线是C1 D1 E。
同理,从C2和C3出发,则有
f3(C2)=6
其相应的决策为u3(C2)= D2
f3(C3)=10
其相应的决策为u3(C3)= D1
第六章 动态规划
数据、模型与决策 (第二版)
当k=2时,有
f2(B1)=12 u2(B1)= C2
f2(B2)=11 u2(B2)= C2
f2(B3)=9 u2(B2)= C2
当k=1时,出发点只有一个A点,则有
f1(A)=15 u1(A)= B1
于是,我们找到从起点A到终点E点的最短距离为15。
为了找出最短路线,再按计算的顺序反推之,可求出最优决策函数序列{u k},即由u1(A)= B1,u2(B1)= C2,u3(C2)= D2,u4(D2)= E组成一个最优策略。因而,找出相应的最短路线为A B1 C2 D2 E。
第六章 动态规划
数据、模型与决策 (第二版)
第六章 动态规划
数据、模型与决策 (第二版)
一般情况下,k阶段与k+1阶段的递推关系可写为
(6-1)
k=n,n-1, ,1
边界条件为
f n+1(sn+1)=0
文档评论(0)