第4节一般数学模型的动态规划解法.pptVIP

下载本文档

56
0
约4.1千字
约 27页
2017-08-11 发布于湖北
举报
版权申诉

第4节一般数学模型的动态规划解法.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第4节一般数学模型的动态规划解法

安徽科技学院最优化技术例1 某公司有资金10万元，若投资于项目i(i=1,2,3)的投资额为xi时，其收益分别为g1(x1)=4x1,g2(x2)= 9x2 , g3(x3)=2x32,问应如何分配投资数额才能使总收益最大？一、非线性规划问题的动态规划解法解静态规划模型：第四节一般数学模型的动态规划解法 1.连续变量的一般解法为了应用动态规划方法求解，人为地赋予它“时段” 的概念，将投资项目排序，首先考虑对项目1投资，然后考虑对项目2投资……，即把问题划分为3个阶段，每个阶段只决定对一个项目应投资的金额。通常把决策变量uk定为原静态规划的变量xk即设状态变量和决策变量有密切关系，状态变量一般为累计量或随递推过程变化的量。可把每阶段可供使用的资金定为状态变量sk，初始状态为s1=10 u1为可分配用于第一种项目的最大资金，则第一阶段时有：第二阶段(k=2)时，状态变量s2为余下可投资于其余两个项目的资金，即：一般地，当第k段时于是有状态变量sk：第k阶段可以投资于第k项到第3个项目的资金决策变量xk：决定给第k项目的资金状态转移方程：sk+1=sk-uk 指标函数：最优指标函数fk(sk)：当可投资金为sk时，投资第k-3项所得最大收益。基本方程为： 0 s s2 x2 当k=2时，这是一个函数求极值问题,利用微分方法可求得该函数有极小值. 当k=3时，显然当，函数取极大值为要讨论s2的具体情况: 当时，当时，此时此时到此，第二阶段的决策已经作出减函数此结论与前矛盾，故舍去当k=1时，时注：此时由前面分析可知而另取此时又是一个求极值问题，微分求解比较[0,10]的端点当时，当时，再由递推方程递推：最优方案为全部资金投到第三个项目 2.连续变量的离散化解法: 例如投资分配问题的一般静态模型为：建立它的动态规划模型，其基本方程为：其状态转移方程为：sk+1=sk-xk 由于sk与xk都是连续变量，当各阶段指标gk(xk)，没有特殊性质而较为复杂时，要求出fk(sk)比较困难，因而求全过程的最优策略也就相当不容易，这时常常采用把连续变量离散化的方法求其数值解，具体做法如下：（1）令sk=0, △,2△,…,m△=a，把区间[0,a]进行分割， △的大小可依据问题所要求的精度及计算机的容量来定。（2）规定状态变量sk及决策变量xk只在离散的点0,△,2△, …, m△上取值，相应的指标函数fk(sk)就被定义在这些离散值上，于是递推方程变为：其中（3）按逆序方法，逐步递推求出fn(sn),…, f1(s1)，最后求出最优资金分配方案。例2 用连续变量的离散化求解解令，将区间[0,10]分割成0,2,6,8,10六个点，即状态变量sk集合为{0,2,4,6,8,10} 允许决策集合为均在分割点上取值。动态规划基本方程为：当k=3时，其中s3和x3的集合均为{0,2,4,6,8,10},计算结果如下表 s3 0 2 4 6 8 10 f3(s3) 0 8 32 72 128 200 x3* 0 2 4 6 8 10 计算结果如下表 s2 0 2 4 6 8 10 x2 0 0 2 0 2 4 0 2 4 6 0 2 4 6 8 0 2 4 6 8 10 g2+f3 0 8 18 32 26 36 72 50 44 54 128 90 68 62 72 200 146 108 86 80 90 f2 0 18 36 72 128 200 x2* 0 2 4 0 0 0 当k=2时，计算结果如下表 s1 10 x1 0 2 4 6 8 10 g1 +f2 200 136 88 60 50 40 f1 200 x1* 0 当k=1时，计算结果表明，最优决策为：最大收益为：与例5结论完全相同。注意：这种方法有可能丢失最优解，一般得到原问题的近似解练习用连续变量的离散化方法求解下面的非线性规划令sk=0,1,2,3,4，列表求解逆序解法: 基本方程: 注意到目标函数是乘积的形式：背包问题的一般提法是：一位旅行者携带背包去登山、已知他所能承受的背包重量限度为a千克，现有n种物品可供他选择装入背包。第i种物品的单件重量为ai干克、其价值(可以是表明本物品对登山的重要性的数量指标)是携带数量xi的函数ci(xi) (i＝1,2,…n),问旅