运筹学第七章 2007.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * 主讲教师: 联系电话: 短 号: E-mail: 清华大学出版社 《运筹学教程》(第三版) 运筹学基础 胡运权 主编 教材 运 筹 帷 幄 之 中 决 胜 千 里 之 外 运 筹 学 课 件 动 态 规 划 第 七 章 第一节 多阶段决策过程的最优化 动态规划 动态规划是解决多阶段决策过程最优化问题的一种方法。它由美国数学家R Bellman于20世纪50年代提出。 状态1 阶段1 阶段2 阶段n 状态2 状态n 决策 决策 决策 多阶段决策过程举例 由于市场需求是一随着时间而变化的因素,因此,为了取得全年最佳经济效益,就要在全年的生产过程中,逐月或者逐季度地根据库存和需求情况决定生产计划安排。 例一、工厂生产过程 例二、设备更新问题 一般企业用于生产活动的设备,刚买来时故障少,经济效益高,即使进行转让,处理价值也高,随着使用年限的增加,就会逐渐变为故障多,维修费用增加,可正常使用的工时减少,加工质量下降,经济效益差,并且,使用的年限越长、处理价值也越低,自然,如果卖去旧的买新的,还需要付出更新费.因此就需要综合权衡决定设备的使用年限,使总的经济效益最好。 多阶段决策过程 例三 连续生产过程的控制问题 一般化工生产过程中,常包含一系列完成生产过程的设备,前一工序设备的输出则是后一工序设备的输入,因此,应该如何根据各工序的运行情况,控制生产过程中各设备的输入和输出,以使总产量最大。 以上所举问题的发展过程都与时间因素有关,因此在这类多阶段决策问题中,阶段的划分常取时间区段来表示,并且各个阶段上的决策往往也与时间因素有关,这就使它具有了“动态”的含义,所以把处理这类动态问题的方法称为动态规划方法。不过,实际中尚有许多不包含时间因素的一类“静态”决策问题,就其本质而言是一次决策问题,是非动态决策问题,但是也可以人为地引入阶段的概念当作多阶段决策问题,应用动态规划方法加以解决。 第二节 动态规划的基本概念和基本原理 贝尔曼等人提出最优化原理 一个过程的最优策略具有这样的性质:无论初始状态及初始决策如何,对于先前决策所形成状态而言,其以后的所有决策应该构成最优策略。 利用这个原理,可以把多阶段决策问题表成一个连续递推过程。 递推(归)思路介绍 河内塔 问题 有A、B、C三根杆,其中B上有若干碟子 每次只能移动一块碟子,小的只能叠在大的上面 把所有碟子从B杆移到A杆上 求解思路: 1)对于只有一个或两个碟子,非常容易移; 2)对于三个碟子,我们可以先把两个碟子移到C,然后把第三个移到A,最后把C上的两个移到A上; 3)对于四个碟子,我们按上述方式可以先把三个碟子移到C,然后把第四个移到A,最后把C上的三个移到A上; 4)依次类推,五个、六个……直到N个都可以移到A,结束。 对于求N个碟子的问题,只要能求得(N-1)个碟子问题就行,同样,求(N-1)个碟子的问题,只要能求得(N-2)个碟子问题就行,依次类推,直只要求1个碟子得问题就行,而一个问题得求解非常简单,可以求得,故整个问题求解结束。 反过来描述 问题分析 问题提出 分析问题提出 如何从找到一条从A到F的最短路径? 从A到F的可以供选择的路径有: 分析问题 P(n)= 2*3*2*2 分阶段决策 问题分析 A B C D E F 阶段 状态 (指标函数) 阶段1 阶段2 阶段3 阶段4 阶段5 阶段6 状态1 状态2 状态3 状态4 状态5 状态6 状态转移 决策和策略 多阶段决策过程的最优化 动态规划方法与“时间”关系很密切,随着时间过程的发展而决定各时段的决策,产生一个决策序列,这就是“动态”的意思。然而它也可以处理与时间无关的静态问题,只要在问题中人为地引入“时段”因素,就可以将其转化为一个多阶段决策问题。 动态规划的基本概念 阶段(k):表示决策顺序的离散量,阶段可按时间或空间划分。 状态(Sk):能确定地表示决策过程当前特征的量。状态可以是数量 也可以是字符,数量状态可以是连续的也可以是离散的。 状态变量(sk):表示每一状态可以取不同值的变量。 当某个状态给定后,在这阶段以后过程的不受这阶段以前的各状态的影响。这个阶段的状态是以前状态的一个总结。这种性质称为无后效性。(可知性) 动态规划中的状态应具有如下性质: 动态规划的基本概念 决策(dk):从某一状态向下一状态过渡时所做的选择。决策是所在状态变量的函数,记为dk(Sk)。 决策允许集合Dk(sk):在状态Xk下,允许采取决策的全体

文档评论(0)

企业资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档