教学插件6动态规划与最优控制模型(20100828武大研究生).doc

教学插件6动态规划与最优控制模型(20100828武大研究生).doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教学插件6动态规划与最优控制模型(20100828武大研究生)

最优控制模型 (管理、决策方面应用,因此可说管理决策模型) §1 最优控制的问题提法: §1.1最优控制问题举例 一、例,详见最优控制课听课笔记第一节; §1.2最优控制数学模型 最优控制模型问题的数学描述――最优控制模型。 寻找(开,闭)可以固定或自由,使得:               其中:  ,且(一阶连续可微),, :向量值函数,且对连续,对连续可微。 上述最优控制的离散模型: 求 , 使得 目标泛函: 达到最小。 而且满足: 状态方程: 最优控制问题的求解方法: 古典变分法:U开集; 极大值原理:U闭集;现代变分法,把古典变分法看作特例 动态规划:便于数值计算,并有通用算法;        发展了变分法,结果是充分条件。 §2最优控制模型的动态规划解法 §2.1动态规划方法概述 §2.2生产——库存——销售管理系统的动态规划解法 §2.1动态规划方法概述 某一类管理问题的数学模型(状态方程)是一个差分方程: 状态方程: 目标泛函: 达到最小。 即: 此为一个阶决策问题: 动态规划法是求这一决策问题的有效办法,具有明显优点: (ⅰ)将一个阶决策问题转化为多次一步决策问题,即数学上的嵌入原理——将求一条极值曲线问题,嵌入到求一族极值曲线的更广泛的类似问题中; (ⅱ)大大简化了计算量; (ⅲ)具有局部优,就是整体优的最优性原理: 可广泛应用于运输系统、生产库存管理系统、生产计划制定及最优投资分配问题、最优价格制定问题。 下面以最短路问题举例说明这种方法 : 一、最短路问题(最小时间问题) 1.问题:若有一辆汽车以城出发经过若干城市到达城,如图:,是一些可以通过的城镇。 ·P1 6 ·P2 1 ·P3 4 4 1 2 4 S · ·F 5 6 3 ·Q1 7 · Q2 2 ·Q3 图中两点间的数字:可以表示两城镇之间的距离(单位10公里),也可以表示行驶两城镇所用时间(应综合考虑:距离远近,路面好坏,是否拥挤等情况)。 于是:汽车从到可经多种途径选择到达。 问题是:从多种途径选择方案中,决定一种使到所走路线最短。或者若图中数字表示时间,则决定一种路径使从到所用时间最短。 2.方法: Ⅰ.决策树法(穷举法): 决策树法是最容易想到的一种方法,但运算量很大——即把所有可能选择的路途所用的时间都求出来,然后取最小值,即有最优策略(最优决策)。 即: 因此有: 1 P3 4 F 15 P2 6 1 Q3 3 F 14 P1 6 2 P3 4 F 16 4 Q2 2 Q3 3 F 15 S 1 P3 4 F 14 5 P2 4 1 Q3 3 F 13 Q 1 7 2 P3 4 F 18 Q2 2 Q3 3 F 17 因此,最终得出: 困难:这样共有8条线路可选择,每条线路要作3次运算。 第1次:;第2次:; 第3次: 因此,共需24次运算:次,若阶段更多,则计算量更大。 II.“走一步瞧一步”(瞎子爬山?近视眼?)法: 第一步:从到或:显然 ,因此取决策; 第二步:从到或:显然 ,因此取均可,但从到 或距离为1,而到距离为2,因此,第

文档评论(0)

liudao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档