- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第10 动态规划
第九章 动态规划 一、基本概念、方程与最优化原理 (一)基本概念 1、阶段k:按时间或空间将全过程划分为若干相互联系的阶段。 例:K=1,2,3,4 2、状态Sk:能确定地表示决策过程当前特征的量。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。 状态可能集合Sk:所有状态点的取值集合 例: S2={B1,B2,B3,B4}, S3={C1,C2,C3} 3、决策Xk:从某一状态向下一状态过渡时所做的选择。决策是所在状态的函数,记为xk(sk),表示第k阶段处于sk状态时所做的决策。 例: X2( B1 )= C2 X3( C2)= D2 决策允许集合Dk(sk):在状态sk下,允许采取决策的全体。 例: D2(B1)={C1,C2,C3} D3(C2)={D1,D2} 4、策略:即各阶段决策组成的决策函数序列。 全过程策略:P1,n(s1),简称策略;达到总体最优—最优策略。 子过程策略:Pk,n(sk):从第k阶段开始到最后第n阶段的决策序列,称k子策略。例:P3,4(C2) 5、状态转移方程 sk+1=Tk(sk,xk) :某一状态以及该状态下的决策,与下一状态之间的函数关系。 6、指标函数:用于衡量所选策略优劣的数量指标。 (1)阶段指标函数rk(sk,xk):从状态sk出发,选择决策xk所产生的第k阶段指标。 (2)过程指标函数Vk,n(sk,xk,xk+1,…,xn):从状态sk出发,选择决策xk,xk+1,…,xn所产生的过程指标。 动态规划要求过程指标具有可分离性,即可加性与可乘性: Vk,n(sk, xk,xk+1,…,xn) = vk(sk,xk)+Vk+1(sk+1,xk+1,…,xn) Vk,n(sk, xk,xk+1,…,xn) = vk(sk,xk)×Vk+1(sk+1,xk+1,…,xn) (3)最优指标函数fk(sk): fk(sk)=opt. Vk,n(sk,xk,xk+1,…,xn) (二)基本方程 对于n阶段的动态规划问题,在求子过程上的最优指标函数fk(sk)时,k子过程与k+1过程的递推关系如下: fk(sk)=min/max {rk(sk,xk)+fk+1(sk+1)} (k=n,n-1,…2,1) 终点条件:fn+1(sn+1)=0 (三)最优化原理 作为整个过程的最优策略具有如下性质: 不管在此最优策略上的某个状态以前的状态和决策如何,对该状态来说,以后的所有决策必定构成最优子策略。就是说,最优策略的任意子策略都是最优的。 二、动态规划求解 具体步骤: (一)建模 (1)确立阶段与阶段变量 (2)确立状态变量与状态可能集合 (3)确立决策变量与决策允许集合 (4)确立状态转移方程 (5)确立阶段效应和目标 (二)建立基本方程 (三)按逆序作出各阶段表格,向前递推 例:最短路问题 例1 解:根据题意,将该问题划分为4个阶段, k=1,2,3,4 sk+1=Tk(sk,xk) fk(sk)=min {rk(sk,xk)+fk+1(sk+1)} f5(s5)=0 1)当k=4时,s4={D1,D2} D4(s4)={E} 2)当k=3时, s3={C1,C2 ,C3} D3(s3)={D1,D2} 3)当k=2时, s2={B1,B2 ,B3 ,B4} D2(s2)={C1,C2 ,C3} 4)当k=1时, s1={A} D1(s1)={B1,B2 ,B3 ,B4} 因此,最短路径为:A—B4—C3—D1—E 最短路长为:14(2+1+1+10=14) 三、动态规划的应用 * 资源分配问题: 例2. 现有资金4万元,投资A、B、C三个项目,每个项目的投资效益与投入该项目的资金有关。三个项目A、B、C的投资效益(万吨)和投入资金(万元)的关系见下表: 求对三个项目的最优投资分配,使总投资效益最大。 阶段k:每投资一个项目作为一个阶段; 状态变量sk:投资第k个项目前的资金数; 决策变量xk:第k个项目的投资额; 决策允许集合:0≤xk≤sk 状态转移方程:sk+1=sk-xk 阶段指标:rk(sk,xk)见表中所示; 递推方程:fk(sk)= max{rk(sk,xk)+fk+1(sk+1)} = max{rk(sk,xk)+fk+1(
文档评论(0)