山东大学 运筹学课件及课后解答8第八章 动态规划(新)a.pptVIP

山东大学 运筹学课件及课后解答8第八章 动态规划(新)a.ppt

  1. 1、本文档共85页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山东大学 运筹学课件及课后解答8第八章 动态规划(新)a.ppt

P217 8.9(a) 选作 二、用动态规划求解线性规划问题 补例: R11=4, R21=12, R31=18 R13=R12 - 0 R23=R22 - 2X2 R33=R32 - 2X2 三、背包问题 作业:P216 8.3 离散 四、生产计划问题 0≤x4≤4=d 五、二维资源分配问题 第三节 离散确定性动态规划模型的求解 一、一维资源分配问题 假定有一种资源,其数量为a,现须将它分配给n个使用者,而使总收益最大。若分配给第i个使用者的数量为xi(i=1,2,…,n),且由此产生的收益(或损失)为gi(xi)(gi(xi)是xi的单调递增(或递减)函数),则该问题的数学模型为: [例4] 某一警卫部门共有9支巡逻队,负责3个要害部位A、B、C的警卫巡逻。对每个部位可分别派出2—4支巡逻队,并且由于派出巡逻队数的不同,各部位预期在一段时期内可能造成的损失有差别,具体数字见表8-1。问该警卫部门应往各部位分别派多少支巡逻队,使总的预期损失为最小。 逆序解法: 阶段k:要害部位(k=1,2,3) 。 状态变量sk:每个阶段初拥有的可派遣的巡逻队数(s1=a=9) 。 决策变量xk:对每个部位派遣的巡逻队数 。 Dk(sk) ={ xk(sk) │ 2≤ xk(sk) ≤4} (k=1,2,3)。 s1 s2 s3 s4 状态转移方程: sk+1= sk – xk (k=1,2,3) 指标函数(递推方程) fk(sk) : s1 s2 s3 s4 X3* =2 作业:P218 8.13 二、设备负荷问题 例:某种机器可在高低两种不同的负荷下运转,高负荷运转时,年损坏率为30%,每台机器的年收益为8万元;低负荷运转时,年损坏率为10%,每台机器的年收益为5万元。若第一年初有1000台设备,问每年如何安排生产,可使得5年内的总收益最大。 第四节 离散随机性动态规划模型的求解 作业:P216 8.4 N——第k+1个阶段可能的状态数; pi(i=1,2,...N)——给定状态sk和决策xk的情况下,下一个可能到达状态的概率; ci(或vi )(i=1,2,...N)——从k阶段状态sk转移到k+1阶段状态为i时的指标函数值。 基本方程: 作业:P216 8.6 第五节 一般问题的动态规划解法 一、用动态规划求解非线性规划问题 0≤R2≤2 [0,2)内一阶导数大于零,故为增函数。 作业:P215 8.1 8.2 第八章 动态规划 第一节 多阶段决策问题 动态规划是用来求解多阶段决策问题的。 多阶段决策问题:可将问题分为若干个相互联系的阶段,在每一阶段分别对应着若干个可以选择的决策,当每个阶段的决策选定之后,也就确定了问题的一个决策过程。将各阶段的决策综合起来,就构成了一个决策序列,称为问题的一个策略。 显然,决策不同,过程的策略也不同。对应于每一个策略,都有一个确定的效果(值)。一般情况下,策略不同,效果也不同。 多阶段决策的目的就是在所有可采取的策略中选取一个最优策略,使在一定条件下取得最优的效果。 例三:将一个数c( c0)分为n个部分c1,c2,…,cn 之和 ,且ci0(i=1,2,…,n), 问如何分割使其乘积 最大? 第二节 最优化原理与动态规划数学模型 2.1 基本思想 将多阶段问题转化为单阶段问题,按着目标要求和递推关系求出最优结果。 (用逆序解法解例1) [例1] 最短路线问题。 设有一个旅行者从图8-1中的A点出发,途中要经过B、C、D等处,最后到达终点E。从A到E有很多条路线可以选择,各点之间的距离如图中所示,问该旅行者应选择哪一条路线,使从A到达E的总路程为最短。 2 5 3 7 5 6 3 2 4 5 5 1 1 4 6 3 3 3 3 4 C1 C3 D1 A B1 B3 B2 D2 E C2 2 5 3 7 5 6 3 2 4 5 5 1 1 4 6 3 3 3 3 4 C1 C3 D1 A B1 B3 B2 D2 E C2 f5(E)=0 f4(D1)=3 f4(D2)=4 f3(C1)=4 f3(C2)=7 f3(C3)=6 f2(B1)=11 f2(B2)=7 f2(B3)=8 f1(A)=11 状态 最优决策 状态 最优决策 状态 最优决策 状态

您可能关注的文档

文档评论(0)

cai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档