管理科学简单概念介绍4.docVIP

  • 3
  • 0
  • 约5.73千字
  • 约 9页
  • 2017-12-22 发布于河南
  • 举报
管理科学简单概念介绍4

管理科学简单概念介绍4 【整理】管理科学简单概念介绍4 [ wxmang ] 于:2010-05-16 02:57:24 复:2898823 8、动态规划 研究多段(多步)决策过程最优化问题的一种数学方法,是最优控制和运筹学的重要数学工具。 为了寻找系统最优决策,可将系统运行过程划分为若干相继的阶段(或若干步),并在每个阶段(或每一步)都作出决策。这种决策过程就称为多段(多步)决策过程。多段决策过程的每一阶段的输出状态就是下一阶段的输入状态。某一阶段所作出的最优决策,对于下一阶段未必是最有利的。多段决策过程的最优化问题必须从系统整体出发,要求各阶段选定的决策序列所构成的策略最终能使目标函数达到极值。 (1)、简史 20世纪40年代,科学家开始研究水力资源的多级分配和库存的多级存储问题。50年代初,美国数学家R.贝尔曼首先提出动态规划的概念,1957年发表《动态规划》一书。在1961、1962年相继出版的第二版和第三版中,又进一步阐明了动态规划的理论和方法。 (2)、多段决策过程 多段决策过程包括阶段、状态、决策、策略和目标函数 5个要素。 ①阶段:把所要求解的过程划分成若干相互联系的阶段,并用□表示阶段变量。 ②状态:表示某一阶段出发位置的状态,它既是上一阶段的输出又是本阶段的输入,并用向量□k表示第□阶段的状态,称为状态变量。 ③决策:指给定□阶段的状态后,从该状态转移到下一阶段某一状态的选择。用U□表示第□阶段当状态处于X□时的决策变量。对于系统的每一个状态,都可以从若干种可能的决策(或控制)中任选一种。选定决策并加以实施,即可引起系统状态的变化。系统的下一阶段状态由现在的状态和决策确定,与过去的历史无关,即系统是无记忆的。 ④策略:由过程中每一阶段所选决策构成的整个序列,又称为方案。 ⑤目标函数:策略的目标是使状态变量的某个特定函数的值为最大(或最小)。这个特定函数就是目标函数。使目标函数值为最大(或最小)的策略称为最优策略。 (3)、基本原理 动态规划的理论基础是最优化原理和嵌入原理。 最优化原理:一个最优策略,具有如下性质:不论初始状态和初始决策(第一步决策)如何,以第一步决策所形成的阶段和状态作为初始条件来考虑时,余下的决策对余下的问题而言也必构成最优策略。最优化原理体现了动态规划方法的基本思想。 嵌入原理:一个具有已知初始状态和固定步数的过程总可以看作是初始状态和步数均不确定的一族过程中的一个特殊情况。这种把所研究的过程嵌入一个过程族的原理称为嵌入原理。通过研究过程族的最优策略族的共同性质得出一般通解,此通解自然也适用于原来的特殊问题。动态规划的基本方法就是根据嵌入原理把一个多步决策问题化为一系列较简单的一步决策问题,可显著降低数学处理上的难度。 应用最优化原理和嵌入原理可推导出动态规划的基本方程,称为贝尔曼方程。(请上网搜索数学表达式) 贝尔曼方程是关于未知函数(目标函数)的函数方程组。应用最优化原理和嵌入原理建立函数方程组的方法称为函数方程法。在实际运用中要按照具体问题寻求特殊解法。动态规划理论开拓了函数方程理论中许多新的领域。 (4)、应用 若多阶段决策过程为连续型,则动态规划与变分法处理的问题有共同之处。动态规划原理可用来将变分法问题归结为多阶段决策过程,用动态规划的贝尔曼方程求解。在最优控制理论中动态规划方法比极大值原理更为适用。但动态规划还缺少严格的逻辑基础。60年代,沃尔昌斯基对动态规划方法作了数学论证。动态规划方法有五个特点: ①在策略变量较多时,与策略穷举法相比可降低维数; ②在给定的定义域或限制条件下很难用微分方法求极值的函数,可用动态规划方法求极值; ③对于不能用解析形式表达的函数,可给出递推关系求数值解; ④动态规划方法可以解决古典方法不能处理的问题,如两点边值问题和隐变分问题等; ⑤许多数学规划问题均可用动态规划方法来解决,例如,含有随时间或空间变化的因素的经济问题。投资问题、库存问题、生产计划、资源分配、设备更新、最优搜索、马尔可夫决策过程,以及最优控制和自适应控制等问题,均可用动态规划方法来处理。 9、经典控制理论 自动控制理论中建立在频率响应法和根轨迹法基础上的一个分支。经典控制理论的研究对象是单输入、单输出的自动控制系统,特别是线性定常系统。经典控制理论的特点是以输入输出特性(主要是传递函数)为系统数学模型,采用频率响应法和根轨迹法这些图解分析方法,分析系统性能和设计控制装置。经典控制理论的数学基础是拉普拉斯变换,占主导地位的分析和综合方法是频率域方法。经典控制理论主要研究系统运动的稳定

文档评论(0)

1亿VIP精品文档

相关文档