运筹学—第七动态规划.pptVIP

下载本文档

31
0
约5.96千字
约 52页
2017-06-13 发布于河南
举报
版权申诉

运筹学—第七动态规划.ppt

1、本文档共52页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

运筹学—第七动态规划

第七章动态规划第一节多阶段决策问题 ;例7-2 机器负荷问题某工厂有100台机器，拟分四个周期使用，在每一个周期有两种生产任务。据经验，把机器x1台投入第一种生产任务，则在一个生产周期中将有1/3台机器报废；余下的机器全部投入第二种生产任务，则有1/10的机器报废，如果干第一种生产任务每台机器可以收益10，干第二种生产任务每台机器可以收益7，问怎样分配机器使总收益最大？ ? 例7-3 资源分配问题假设有一种资源其数量为a，现将它分配给n个使用者。若分配给第i个使用者的数量为xi（i=1，…，n），产生的相应收益为gi（xi），问如何分配使总收益最大？投资决策问题、生产存贮问题、采购问题、设备更新问题等都具有多阶段决策问题的特征，都可以用动态规划方法求解。 ;第二节动态规划的基本概念和基本原理 ?一、动态规划的基本概念 1.阶段（stage）描述阶段的变量称为阶段变量（k） k=1，A——B； k=2，B——C； k=3，C——D； k=4，D——E。 2.状态（state）状态表示各阶段开始所处的自然状况或客观条件，它既是某阶段过程演变的起点，又是前一阶段某种决策的结果。描述状态的变量称为状态变量（sk) 。状态变量sk的取值集合称为状态集合，第k阶段的状态集合记为Sk ，;状态的选取应当满足无后效性：系统从某个阶段往后的发展演变，完全由系统本阶段所处的状态及决策所决定，与系统以前的状态及决策无关。也就是说，过去的历史只能通过当前的状态去影响未来的发展，当前的状态是过去历史的一个完整总结。只有具有无后效性的多阶段决策过程才适合于用动态规划方法求解。;3.决策（decision）当各阶段的状态选定以后可以做出不同的决定（或选择）从而确定下一个阶段的状态，这种决定（或选择）称为决策。表述决策的变量称为决策变量，常用uk（sk）表示第k阶段当状态为sk时的决策变量。实际问题中，决策变量的取值往往限制在某一范围内，此范围称为允许决策集合，常用Dk（sk）表示第k阶段从状态sk出发的允许决策集合，uk（sk）∈Dk（sk）。从B2出发，可以选择C1，C2，C3，C4，即允许决策集合为： D2（B2）=｛C1，C2，C3，C4｝当决定选择C3时，可以表示为：u2（B2）=C3;4.策略（policy）当各个阶段的决策确定以后，各阶段的决策形成一个决策序列，称此决策序列为一个策略。使系统达到最优效果的策略称为最优策略。在n阶段决策过程中，从第k阶段到终止状态的过程，称为k后部子过程（或称为k子过程），k后部子过程相应的决策序列称为k后部子过程策略，简称子策略，记为pk，n（sk）： pk，n（sk）=｛uk（sk），uk+1（sk+1），…，un（sn）｝当k=1时，即由第一阶段某个状态出发做出的决策序列称为全过程策略，简称策略，记为p1，n（s1）： p1，n（s1）=｛u1（s1），u2（s2），…，un（sn）｝ ;5.状态转移方程（state transfer equation）设第k阶段状态为sk，做出的决策为uk（sk），则第k+1阶段的状态sk+1随之确定，他们之间的关系可以表示为： sk+1=Tk（sk，uk）表示从第k阶段到第k+1阶段状态转移规律的方程称为状态转移方程，它反映了系统状态转移的递推规律。;6.指标函数和最优指标函数衡量所选策略优劣的数量指标称为指标函数。它定义在全过程和所有后部子过程，常用Vk，n表示，即： Vk，n=Vk，n（sk，uk，sk+1，…，sn+1）当k=1时，V1，n表示初始状态为s1，采用策略p1，n时的指标函数值。 V1，n=V1，n（s1，u1，s2，…，sn+1）动态规划数学模型的指标函数应该具有可分离性，并满足递推关系，即： Vk，n（sk，uk，sk+1,…,sn+1）=Ψk[sk，uk，Vk+1，n(sk+1,…,sn+1)] 在阶段k状态为sk，决策为uk（sk）时得到的反映第k阶段的数量指标vk（sk，uk）称为k阶段的指标函数。在最短路线问题中，第k阶段指标函数vk（sk，uk）通常也用dk（sk，uk）表示。 ;常见的指标函数形式有两种：（1）任一后部子过程的指标函数是它所包含的各阶段指标的和，即： Vk，n（sk，uk，…，sn+1）= 写成递推关系： Vk，n（sk，uk，…，sn+1）= vk（sk，uk）+ Vk+1，n（sk+1，uk+1，…，sn+1）（2）任一后部子过程的指标函数是它所包含的各阶段指标的积，即： Vk，n（sk，uk，…，sn+1）= 写成递推关系： Vk，n（sk，uk，…，sn+1）= vk（sk，uk）·Vk+1，n（sk+1，uk+1，…，sn+1）;指标函数的最优值记为f

您可能关注的文档

文档评论（0）

mk808606 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

运筹学—第七动态规划.pptVIP