- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
专业课运筹学动态规划笔记
笔记信息
书籍信息:《运筹学》第五版——清华大学出版社胡运权
单元信息:第六章动态规划
✿整理摊主:铭哥
本篇文章共2294个字
食用时间约11分钟
【1】概念原理
多阶段决策特点
▶多阶段决策是与时间相关的;
▶多阶段决策依赖于当前的状态;
▶每一个时段都要作出决策;
▶全部过程的决策是一个决策序列;
▶本段决策的执行将影响下一阶段的决策;
▶不仅要考虑本阶段最优,更要考虑全局最优;
最优性原理
▶无论过去的状态和决策如何,对前面决策所形成的状态而言,余下的诸决策必须构成最优策
略;
▶将决策问题划分为若干个阶段,全过程的优化问题就分解为子过程的优化问题,由后向前逐步
倒推,最优化的子过程逐渐成为全过程最优;
▶作为全过程的最优策略P*1,n的组成部分的任一子策略P*k,n(Sk),一定是从状态Sk出发直至
终点的最优策略。
相关概念
▶阶段
将所给问题的过程,按时间或空间特征分解成若干相互联系的阶段,以便按次序去求每个阶段
的解。常用字母k表示。
▶状态
各阶段开始时的客观条件。状态用变量Sk表示。
▶决策
确定下一阶段的状态,表示决策的变量称为决策变量,Uk(Sk)表示第k阶段的状态为Sk时的
决策变量,它是状态变量的函数。
▶策略
各段决策确定后,整个问题的决策序列就构成一个决策序列。
▶状态转移方程
确定过程由一个状态到另一个状态的演变过程。若给定第k阶段状态变量Sk的值,如果该段的
决策变量Uk一经确定,第k+1阶段的状态变量Sk+1的值也就完全确定。
▶指标函数(最优指标函数)
用来衡量所选定策略优劣的数量指标。
阶段指标函数:从状态Sk出发,采取决策Uk时的效益。用Vk(Sk,Uk)表示。
最优指标函数fk(sk):表示从第k段状态sk采用最优策略P*k,n到过程终止时的最优指标函数
值。
【2】基本方程
一般方程
▶顺序推解的基本方程:
▶逆序解法的基本方程:
模型求解
▶顺推解法
▶逆推解法
基本思路:逆着阶段顺序的方向,由后向前推算。
求解步骤:
①把寻求最优策略看作连续递推过程,从最终阶段开始,逆着实际过程的进展方向逐段求解;
②在每一阶段求解过程中都是其后部子过程最优策略的基础上,再考虑本阶段的指标函数,求出
本阶段的最优策略;
③直到第一阶段为止。
建模注意事项
▶将问题的过程划分为恰当的阶段,如时间、空间顺序,或是变量的个数,产品的种类,小组的
个数等;
▶正确选择状态变量Sk,通常表示为从第k阶段到第n阶段的累计量和递推量(逆推时);或者
从第1阶段到第k阶段的累计量和递推量(顺推时);
▶确定决策变量及每阶段的允许决策集合,通常表示为xk∈Dk(Sk,xk),即在第k阶段投入的
量;
▶正确写出状态转移方程Sk+1=Tk(Sk,xk),注意顺推和逆推的区分!
▶正确写出最优值函数fk(Sk),注意顺推和逆推的区分!如逆推时,求最大化问题
▶边界条件,指标函数加和时,通常为0;指标函数乘积时,通常为1。
【3】应用类型
资源分配问题
▶概念
所谓分配问题,就是将数量一定的一种或若干种资源(如原材料、资金、机器设备、劳力、食
品等等),恰当地分配给若干个使用者,而使目标函数为最优。
▶通常数学描述如下:
设有某种原料,总数量为a,用于生产n种产品。若分配数量xi用于生产第i种产品,其收益为
gi(xi)。问应如何分配,才能使生产n种产品的总收入最大?
▶用动态规划方法处理该类问题时,通常以把资源分配给一个或几个使用者作为一个阶段,把问
题中的变量xi作为决策变量,将累计的量或随递推过程变化的量选为状态变量。
▶相关问题:
在实际中,如销售分配问题、投资分配问题、货物分配问题等,都属于这类分配问题。这种只
将资源合理分配不考虑回收的问题,又称为资源平行分配问题。
在资源分配问题中,若考虑资源回收利用,则决策变量取连续值,称为资源连续分配问题。
生产与存储问题
▶概念
在生产和经营中,经常遇到要合理安排生产(或购买)与库存的问题,达到既要满足社会的需
要,又要尽量降低成本费用。因此,正确制定生产(或采购)策略,确定不同时期的生产量
(或采购量)和库存量,以使总的生产成本费用和库存费用之和最小,这就是生产与存储问题
的最优化目标。
▶通常的数学描述为:
设某公司对某种产品要制定一项n个阶段的生产(或购买)计划。已知它的初始库存量为0,
每阶段生产(或
文档评论(0)