- 1、本文档共165页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章动态规划 本章内容重点 多阶段决策过程的最优化问题特点 动态规划的基本概念、基本原理和求解思路 离散型动态规划求解方法 连续型动态规划求解方法 动态规划方法应用举例 引例一、某运输公司拟将一大型设备从下列交通网络的A点运输到F点,试用动态规划求从A到F的最短路径。 引例二、某企业生产某种产品,每月月初按订货单发货,生产的产品随时入库,仓库最多能够贮存产品90千件。在1至6月其生产成本和产品订单的需求数量情况如下表: 已知上一年底库存量为40千件,要求6月底库存量仍能够保持40千件。问:如何安排这6个月的生产量,使既能满足各月的定单需求,同时生产成本最低。 1.多阶段决策过程的最优化1.1 多阶段决策问题(Multi-Stage decision process) . 多阶段决策过程的特点 动态规划方法与“时段”关系很密切: “动态”表现在 —— 随着时段过程的发展而决定各时段的决策,产生一个决策序列。 时段可以是客观实际。 在处理与时间无关的静态问题时,也可以通过在问题中人为地引入“时段”因素,将其转化为一个多阶段决策问题。 1.2 多阶段决策问题举例 1)工厂生产过程:由于市场需求是一随着时间而变化的因素,因此,为了取得全年最佳经济效益,就要在全年的生产过程中,逐月或者逐季度地根据库存和需求情况决定生产计划安排。 1.2 多阶段决策问题举例 2)设备更新问题:一般用于生产活动的设备,刚买来时故障少,经济效益高,即使进行转让,处理价值也高,随着使用年限的增加,就会逐渐变为故障多,维修费用增加,可正常使用的工时减少,加工质量下降,经济效益差,并且,使用的年限越长、处理价值也越低,自然,如果卖去旧的买新的,还需要付出更新费。因此就需要综合权衡决定设备的使用年限,使总的经济效益最好。 1.2 多阶段决策问题举例 3)连续生产过程的控制问题:一般化工生产过程中,常包含一系列完成生产过程的设备,前一工序设备的输出则是后一工序设备的输入,因此,应该如何根据各工序的运行情况,控制生产过程中各设备的输入和输出,以使总产量最大。 1.2 多阶段决策问题举例 实际中尚有许多不包含时间因素的一类“静态”决策问题,就其本质而言是一次决策问题,是非动态决策问题,但是也可以人为地引入阶段的概念当作多阶段决策问题,应用动态规划方法加以解决。 1.2 多阶段决策问题举例 4) 资源分配问题:工业部门或公司,拟对其所属企业进行稀缺资源分配,为此需要制定出收益最大的资源分配方案。这种问题原本要求一次确定出对各企业的资源分配量,它与时间因素无关,不属动态决策,但是,我们可以人为地规定一个资源分配的阶段和顺序,从而使其变成一个多阶段决策问题。 1.2 多阶段决策问题举例 5) 运输网络问题:如图7-1所示的运输网络,点间连线上的数字表示两地距离(也可是运费、时间等),要求从 v1 至 v10 的最短路线。 这种运输网络问题也是静态决策问题。但是,按照网络中点的分布,可以把它分为4个阶段,而作为多阶段决策问题来研究。 1.3 动态规划求解的多阶段决策问题的特点 通常多阶段决策过程的发展是通过状态的一系列变换来实现的。 一般情况下,系统在某个阶段的状态转移除与本阶段的状态和决策有关外,还可能与系统过去经历的状态和决策有关。 适合于用动态规划方法求解的只是一类特殊的多阶段决策问题,即具有无后效性的多阶段决策过程。 1.3 动态规划求解的多阶段决策问题的特点 无后效性(又称马尔柯夫性) 指系统从某个阶段往后的发展,仅由本阶段所处的状态及其往后的决策所决定,与系统以前经历的状态和决策(历史)无关。 1.4 动态规划方法导引 为了说明动态规划的基本思想方法和特点,下面以图7-1所示为例讨论的求最短路问题的方法。 图7-1 运输网络图示 1.4 动态规划方法导引 一般有三种思路求解 1)全枚举法或穷举法:它的基本思想是列举出所有可能发生的方案和结果,再对它们一一进行比较,求出最优方案。 从v1到v10的路程共有3×2×2×1=12条可能的路线,分别算出各条路线的距离,最后进行比较,可知最优路线是v1 →v3 → v7 → v9 →v10 ,最短距离是18.用穷举法求最优路线的计算工作量将会十分庞大,而且其中包含着许多重复计算. 1.4 动态规划方法导引 2)局部最优路径法:某人从k点出发,并不顾及全线是否最短,只是选择当前最短途径,“逢近便走”。在这种想法指导下,所取决策必是v1 →v3 →v5 → v8 → v10 ,全程长度是20;显然,这种方法的结果常是错误的. 1.4 动态规划方法导引 3)动态规划方法
文档评论(0)