- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 第八章 动态规划问题及求解 8.1 多阶段决策问题 动态规划是解决这样一类最优化问题的专门计算方法,这类问题允许把它的过程(求解)分解为一系列的单级过程(步骤)。 最优化原理:达到系统某种状态的过程无论是怎样的,以这个状态为初始状态的剩余过程的求解仍是最优的规划。也就是说,当系统处于第 个状态时,只要最优 规划剩余的 个过程,便可逐步求出 时的 最优解。 为了方便讨论动态规划的求解过程,我们把动态规划 问题化分为下面几个过程: 阶段(stage):把问题恰当的分为若干个相互联系 的阶段; 2.状态(State):它是表示某段的出发位置,是某支路 的起点,又是前一段某支路的终点。第 个阶段的状态 变量 应该包含前各阶段决策过程的全部信息,且之后 作出的决策与之前的状态和决策无关。 3.决策(Decision):是指某阶段初从给定的状态出发 决策者所作出的选择,决策变量 表示第 个阶段 状态为 时对方案的选择。决策允许范围记为 , 4.策略(Policy):即决策序列。 个阶段动态规划问题 的策略可记为 ,当 时, 表示从 阶段开始到最后的决策 序列。 5.状态转移方程:表明后一阶段和前一阶段之间的 阶段状态和决策给定之后,第 关系。当第 阶段状态就确定了,记为 6.指标函数:阶段指标函数----对应于某一阶段状态和从该 状态出发的决策的某种指标度量。第 阶段指标函数记 为 ;过程指标函数----从某阶段开始到最后 过程的指标度量。记为 ,最优策略值记为 7.动态规划基本方程:过程指标函数是各阶段指标函数 的函数。 8.2 动态规划问题的解法 例1.设某仓库有12人巡逻守卫,负责4个要害部位,对每个部位可分别派2到4人巡逻,由于巡逻人数不同,各部位预期在一段时间内可能造成的损失也不一样,具体数字见下表。问该卫队应往各部位分别派多少人巡逻才能使预期损失最小? 34 31 25 24 22 21 38 35 31 18 14 10 2人 3人 4人 D C B A 把12人派往4个部位看作4个阶段(k=1,2,3,4),每个阶段初可派遣的人数是前面阶段决策的结果,也是本阶段决策的依据。用 表示第 个阶段的状态变量,用 表示第 个阶段的决策变量(即在该阶段派出的 人数,显然 ),各阶段可允许的决策集合 状态转移方程为 用 表示第 个阶段派出的巡逻人数为 时,在该部位的预期损失值 过程指标函数 由于 用 表示从第 个阶段到结束时预期损失值, (1)先考虑D部位 (2)先考虑C,D部位 由于 ,所以 (3)先考虑B,C,D部位 由于 ,所以 (4)先考虑A,B,C,D部位 由于 ,所以 由此可见,A,B,C,D四个部位应分别派4人,2人, 2人,4人,预期损失值为97。 例5.求从A点到G点的最段路线 解:从A到G分六个阶段:A-B,B-C,C-D,D- E,E-F,F-G (1)第六阶段F-G最短路 例2 (2)第五阶段E-G最短路 (3)第四阶段D-G最短路 (4)第三阶段C-G最短路 (5)第二阶段B-G最短路 (6)第一阶段A-G最短路 所以最短路是:A-B1-C2-D1-E2-F2-G, 最短路长为18。 例3.求下列非线性规划问题 解:要求 的值,我们分三个阶段, 分别为第1,2,3阶段的决策变量。 设状态变量为 ,显然 阶段指标函数 第三阶段 2.第二阶段 3.第一阶段 所以 最优值为 例4 设备平行分配 某公司根据国家计划的安排拟将某种设备5台分给甲乙丙三个厂,各厂获得这种设备每年可向国家提供的利润如下表: 设备台数 工厂 0 1 2 3 4 5 12 12 11 6 4 0 丙 11 11 11 10 5 0 乙 13 12 9 7 3 0 甲 解:分3个阶段,甲—第3厂,乙---第2厂,丙---第1厂 设 为第 k 厂获得的台数 为 台设备分配给第 k 个厂所得利润. 表示当前 k状态下的已分的设备总数 表示当前状态下 台设备所得的最大利润 第一阶段,考虑丙厂(k=1) 第2阶段,考虑乙,丙厂(k=2) 第3阶段,考虑甲,乙,丙厂(k=3) 有两种分配方案:总最大利润21 方案1:甲—0,乙—2,丙—3 方案2:甲—2,乙—2,丙—1 第九章 LINGO8.0编程介绍 LINGO程序的背景及应用 美国芝加哥(Chicago)大学的Linus Schrage教授于1980年前后开发, 后来成立 LINDO
文档评论(0)