动态规划讲解例子.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* A B C T 变换 4+3 6+4 5+8 6+5 6+4 8+6 5+3 7+5 3+9 10+3 B + C A+B * 排序 4+3 6+4 5+8 6+5 6+4 8+6 5+3 7+5 3+9 10+3 B + C A+B 复原 3 4 6 8 5 6 4 6 8 3 5 7 9 3 10 C B A * 计算 T = 6+10+8+7+6+4+3 = 44 计算依据: THANK YOU SUCCESS * * 可编辑 * 2、在多阶段决策过程中,动态规划方法是既把当前一段和未来一段分开,又把当前效益和未来效益结合起来考虑的一种最优化方法。因此,每段决策的选取是从全局来考虑的,与该段的最优选择答案一般是不同的. 最优化原理:作为整个过程的最优策略具有这样的性质:无论过去的状态和决策如何,相对于前面的决策所形成的状态而言,余下的决策序列必然构成最优子策略。也就是说,一个最优策略的子策略也是最优的。 3、在求整个问题的最优策略时,由于初始状态是已知的,而每段的决策都是该段状态的函数,故最优策略所经过的各段状态便可逐段变换得到,从而确定了最优路线。 * 动态规划求解的多阶段问题的特点: 每个阶段的最优决策过程只与本阶段的初始状态有关,而与以前各阶段的决策(即为了到达本阶段的初始状态而采用哪组决策路线无关)。换言之,本阶段之前的状态与决策,只是通过系统在本阶段所处的初始状态来影响本阶段及以后各个阶段的决策。或者说,系统过程的历史只能通过系统现阶段的状态去影响系统的未来。 具有这种性质的状态称为无后效性(即马尔科夫性)状态。 动态规划方法只适用于求解具有无后效性状态的多阶段决策问题。 * 现有数量为a(万元)的资金,计划分配给n 个工厂,用于扩大再生产。 假设:xi 为分配给第i 个工厂的资金数量(万元);gi(xi)为第i 个工厂得到资金后提供的利润值(万元)。 问题:如何确定各工厂的资金数,使得总的利润为最大。 据此,有下式: 三. 投资分配问题 * 令:fk(x) 表示 以数量为 x 的资金分配给前k 个工厂,所得到的最大利润值。 用动态规划求解,就是求 fn(a) 的问题。 当 k=1 时, f1(x) = g1(x) (因为只给一个工厂) 当1<k≤n 时,其递推关系如下: 设:y 为分给第k 个工厂的资金(其中 0≤y ≤ x ),此时还剩 x - y(万元)的资金需要分配给前 k-1 个工厂,如果采取最优策略,则得到的最大利润为fk-1(x-y) ,因此总的利润为: gk(y) + fk-1(x-y) * 如果a 是以万元为资金分配单位,则式中的y 只取非负整数0,1,2,…,x。上式可变为: 所以,根据动态规划的最优化原理,有下式: * 例2:设国家拨给60万元投资,供四个工厂扩建使用,每个工厂扩建后的利润与投资额的大小有关,投资后的利润函数如下表所示。 投资 利润 0 10 20 30 40 50 60 g1(x) 0 20 50 65 80 85 85 g2(x) 0 20 40 50 55 60 65 g3(x) 0 25 60 85 100 110 115 g4(x) 0 25 40 50 60 65 70 解:依据题意,是要求 f4(60) 。 * 按顺序解法计算。 第一阶段:求 f1(x)。显然有 f1(x) = g1(x),得到下表 投资 利润 0 10 20 30 40 50 60 f1(x) = g1(x) 0 20 50 65 80 85 85 最优策略 0 10 20 30 40 50 60 第二阶段:求 f2(x)。此时需考虑第一、第二个工厂如何进行投资分配,以取得最大的总利润。 * 最优策略为(40,20),此时最大利润为120万元。 同理可求得其它 f2(x) 的值。 THANK YOU SUCCESS * * 可编辑 * 最优策略为(30,20),此时最大利润为105万元。 * 最优策略为(20,20),此时最大利润为90万元。 最优策略为(20,10),此时最大利润为70万元。 * 最优策略为(10,0)或( 0 , 10 ) ,此时最大利润为20万元。 f2(0) =0。最优策略为(0,0),最大利润为0万元。 得到下表 最优策略为(20,0),此时最大利润为50万元。 * 投资 利润 0 10 20 30 40 50 60 f2(x) 0 20 5

文档评论(0)

iuad + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档