- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运 筹 学 第五章 动态规划 §3 建立动态规划数学模型的步骤 “最优化原理”是动态规划的核心,所有动态规划问题的递推关系都是根据这个原理建立起来的,并且根据递推关系依次计算,最终可求得动态规划问题的解。 一般来说,利用动态规划求解实际问题需先建立问题的动态模型,具体步骤如下: ⒈将问题按时间或空间次序划分成若干阶段。有些问题不具有时空次序,也可以人为地引进时空次序,划分阶段。 ⒉正确选择状态变量xk。这一步是形成动态模型的关键,状态变量是动态规划模型中最重要的参数。一般来说,状态变量应具有以下三个特性: ⑴要能够用来描述决策过程的演变特征。 ⑵要满足无后效性。即如果某阶段状态已给定后,则以后过程的进展不受以前各状态的影响,也就是说,过去的历史只通过当前的状态去影响未来的发展。 ⑶递推性。即由k阶段的状态变量xk及决策变量uk可以计算出k+1阶段的状态变量xk+1。 * * ⒊确定决策变量uk及允许决策变量集合Dk(uk)。 ⒋根据状态变量之间的递推关系,写出状态转移方程: xk+1=T(xk, uk(xk)) ⒌建立指标函数。一般用rk(xk, uk)描写阶段效应,fk(xk)表示k—n阶段的最优子策略函数。 ⒍建立动态规划基本方程: fk(xk)= opt{ rk(xk, uk(xk))﹡fk+1(xk+1)} uk∈ Dk(uk) fn+1(xn+1)=C k=n,n-1,…,1 以上是建立动态规划模型的过程,这个过程是正确求解动态规划的基础。 在动态规划基本方程中, rk(xk, uk), xk+1=T(xk, uk)都是已知函数,最优子策略fk(xk)与fk+1(xk+1)之间是递推关系,要求出fk(xk)及uk(xk),需要先求出fk+1(xk+1),这就决定了应用动态规划基本方程求最优策略总是逆着阶段的顺序进行的。由后向前逐步计算,最终可以算出全过程的最优策略函数值及最优策略。 另一方面,由于k+1阶段的状态xk+1=T(xk, uk)是由前面的状态xk和决策uk所形成的,在计算fk+1(xk+1)时还不能具体确定xk+1的值,所以,这就要求必须就k+1阶段的各个可能状态计算fk+1(xk+1),因此动态规划方法不但能求出整个问题的最优策略和最优目标值,而且还能求出决策过程中所有可能状态的最优策略及最优目标值。 下面就按上述步骤求解例2。 例2(带回收的资源分配问题)某厂新购某种机床125台。据估计,这种设备5年后将被其它设备所代替。此机床如在高负荷状态下工作,年损坏率为1/2,年利润为10万元;如在低负荷状态下工作,年损坏率为1/5,年利润为6万元。问应如何安排这些机床的生产负荷,才能使5年内获得的利润最大? 解:以年为阶段,k=1,2,3,4,5 取k年初完好的机床数为状态变量xk 以k年初投入高负荷运行的机床数为决策变量uk,则低负荷运行机床数是xk-uk,于是状态转移方程为: xk+1=1/2uk+4/5(xk-uk)=0.8xk-0.3uk 以利润为目标函数,则k年利润为: 10uk+6(xk-uk)=4uk+6xk 记fk(xk)为k年至5年末最大总利润,则动态规划基本方程为: fk(xk)= max{ 4uk+6xk+fk+1(0.8xk-0.3uk)} 0≤uk≤xk f6(x6)=0 k=5,4,3,2,1 以上是建立动态模型的过程,下面具体求解。 注意动态规划基本方程为: fk(xk)= max{ 4uk+6xk+fk+1(0.8xk-0.3uk)} 0≤uk≤xk 所以,当k=5时,有 f5(x5)= max{ 4u5+6x5+f6(x6)}=10x5 u5=x5 0≤u5≤x5 当k=4时 f4(x4)= max{ 4u4+6x4+f5(0.8x4-0.3u4)} 0≤u4≤x4 = max{ 4u4+6x4+10(0.8x4-0.3u4)} 0≤u4≤x
文档评论(0)