网站大量收购独家精品文档,联系QQ:2885784924

[管理学]动态规划0801.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[管理学]动态规划0801

第五章 动态规划 5.1 动态规划的基本概念 5.2 动态规划的最优性检验 5.3 建立动态规划数学模型的步骤 5.1 动态规划的基本概念 动态规划是解决多阶段决策过程最优化问题的一种方法。该方法是由美国数学家贝尔曼(R Bellman)等人在20世纪50年代初提出的。他们针对多阶段决策问题的特点,提出了解决这类问题的最优化原理,并成功地解决了生产管理、工程技术等方面的许多实际问题,从而建立了运筹学的一个新分支。 动态规划是现代企业管理中的一种重要决策方法,可用于解决最优路径问题,资源分配问题,生产计划与库存,投资等问题及生产过程的最优控制等。由于它有独特的解题思路,在处理某些优化问题时,比线性规划问题或非线性规划方法更有效。 动态规划问题的基本概念: (1)阶段:将所给问题的过程,按时间或空间特征 征分解成若干互相联系的阶段,以便按次序去求每阶段的解,常用字母k表示阶段变量。 (2)状态:各阶段开始时的客观条件叫做状态。描述各阶段状态变量称为状态变量,常用 表示第k阶段的状态变量,状态变量 的取值集合称为状态集合,用 表示。 动态规划中的状态应具有如下性质:当某阶段状态给 定后,在这阶段以后过程的发展不受这段以前各段状态的影响。 (3)决策和策略 当各阶段的状态取定后,就可以做出不同的决策(或策略),从而确定下一阶段的状态,这种决定称为决策。表示决策的变量,称为决策变量常用 表示 第k阶段当状态为 时的决策变量。 (4)状态转移方程 动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。如果给定了第k阶段的状态 ,本阶段决策为 ,则第k+1段的状态 也就完全确定,他们的关系是 由于它表示了由k段到k+1段的状态转移规律 ,所以称为状态转移方程。 (5)指标函数 用于衡量所选定策略优劣的数量指标称为指标函数。 5.2 动态规划的最优性原理 整个过程的最优策略具有这样的性质,即无论过去的状态和决策如何,对前面的决策阶段形成的状态而言,余下的诸策略必须构成最优策略。 简言之,最优性原理的含义就是,最优策略的任何 一部分子策略也必须是最优的。 今天作出决策只影响明天,不影响后天,影响后天是通过明天的决策来影响即无后效性的多阶段决策过程的特点。 例1 是由A到E的最短路线,任取一点 ,按照最优性原理, 应该是 到 的最短路。用反证法证明这一结论的正确性。 按照最优性原理,可以将例1分成 4个阶段,由后向前逐步求出各点到E的最短线路,直至求出A到E的最短线路。 逆序,也有顺序解法,我们只介绍逆序解法 K=4时,出发点 ,即 为 到E的最短距离为; 表示从状态 出发采取的决策。显然: K=3时,出发点有 这里 是第K阶段采用 决策产生的阶段效应: 是边界条件,“﹡”号大多数情况下是“+”号,也可能是“×”号。称上述递进关系为动态规划的基本方程,这个方程是最优性原理的具体表现形式。 5.3 建立动态规划数学模型的步骤: 例2 (带回收的资源分配问题)某厂就购进机床125台,据统计,这种设备5年后将被其它设备所代替,此机床如在额符状态下工作,年损坏率为 ,年利润为6万元。问如何安排这些机床的生产负荷,才能使5年内获得的利润最大? 解:以年为阶段,k=1,2,3,4,5 取k年初完好的机床数为状态变量 。以k年初投入高负荷运行的机床数为决策变量 ,则低负荷运行机床数是 于是状态转移方程: 逆算顺推得如下最优计划安排表: 动态规划应用举例: 资源分配问题 给定一定数量的某种资源,例如人力、资金、设备、材料等,将其投入多种活动,就会产生如何分配资源给各项活动,使总效果最优的问题,这就是资源分配问题 例某公司拟将500万元资金投放下属的A、B、C三个企 业,各企业获得资金后的收益如表所示,试确定总收益 最大的投资分配方案。 解:以分别向A、B、C三个企业分配资金为阶段,k=1,2,3。取k阶段初拥有的资金数为状态变量 ,决策变量 为分配给企业k的资金数,则状态转移方程是: 令 为k企业至第三个企业按最优分配方案获得的最大收益,则

文档评论(0)

ipbohn97 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档