- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数学建模:第五章 运筹与优化模型.ppt
说明 1)此例揭示了动态规划的基本思想。 2)动态规划方法比穷举法(48种)大大节省了计算量。 3)计算结果不仅得到了 到 的最短线路和最短距离,而且得到了其它各点到 的最短线路和最短距离,这对于很多实际问题来说是很有用处的。 动态规划法求解的数学描述 讨论动态规划中最优目标函数的建立,一般有下列术语和步骤: 1、阶段 用动态规划求解多阶段决策系统时,要根据具体情况,将系统适当地分成若干个阶段,以便分若干个阶段求解,描述阶段的变量称为阶段变量。 上例分六个阶段,是一个六阶段的决策过程。例中由系统的最后阶段向初始阶段求最优解的过程称为动态规划的逆推解法。 2、状态 状态表示系统在某一阶段所处的位置或状态。 上例中第一阶段有一个状态, 第二阶段有两个状态, 过程的状态可用状态变量 来描述,某个阶段所有可能状态的全体可用状态集合来描述, 3、决策 某一阶段的状态确定之后,从该状态演变到下一阶段某一状态所作的选择称为决策。描述决策的变量称为决策变量 如上例中在第k阶段用 表示处于 状态时的决策变量。 决策变量限制的范围称为允许决策集合。 用 表示第k阶段从 出发的决策集合。 4、策略 由每阶段的决策 (i=1,2,…,n)组成的决策函数序列称为全过程策略或简称策略,用p表示, 由系统的第k个阶段开始到终点的决策过程称为全过程的后部子过程,相应的策略称为后部子过程策略。 用 表示k子过程策略, 对于每一个实际的多阶段决策过程,可供选择的策略有一定的范围限制,这个范围称为允许策略集合。 允许策略集合中达到最优效果的策略称为最优策略。 5、状态转移 某一阶段的状态变量及决策变量取定后,下一阶段的状态就随之而定。 设第k个阶段的状态变量为 ,决策变量为 ,则第k+1个阶段的状态 用 表示从k阶段到k+1阶段的状态转移规律,称它为状态转移方程。 6、阶段效益 系统某阶段的状态一经确定,执行某一决策所得的效益称为阶段效益,它是整个系统效益的一部分,是 阶段状态和 阶段决策的函数, 记为 7、指标函数 指标函数是系统执行某一策略所产生的效益的数量表示,根据不同的实际问题,效益可以是利润、距离、产量或资源的耗量等。 指标函数可以定义在全过程上,也可以定义在后部子过程上。指标函数往往是各阶段效益的某种和式,取最优策略时的指标函数称为最优策略指标。 如上例中, 表示从 出发到终点 的最优策略指标。 上例中 显然为零,称它为边值条件。 而动态规划的求解就是对k=n,n-1,…,2,1逐级求出最优策略指标的过程。 8、动态规划的基本方程 例9:机器负荷分配问题 某种机器可以在高低两种负荷下生产,年产量与年初投入生产的机器数有关。在高负荷下生产时,年产量 ,式中 为投入生产的机器数,年终的完好机器数为 ,称系数0.7为机器完好率。在低负荷下生产时,年产量 ,式中 为投入生产的机器数,机器完好率为0.9,设开始时,完好的机器数为 台,要求制定一个五年计划,在每年开始时决定如何重新分配完好机器在两种不同负荷下工作的数量,使五年的总产量最高。 解:此问题与上例类似。 设阶段变量k表示年度; 状态变量 是第k年初拥有的完好机器数(也是第k-1年度末完好机器数)。 决策变量 规定为第k年度中分配在高负荷下生产的机器数。 于是 是该年度分配在低负荷下生产的机器数。 k=2 k=3 k=4 k=5 记 表示第k年到第五年末的最高总产量 k=5时 这说明第5年初要把全部完好机器投入高负荷下生产。 k=4时 k=3时 k=2时
原创力文档


文档评论(0)