- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 动态规划 第15讲 随机型动态规划及软件介绍 一、离散随机性动态规划 随机型的动态规划是指状态的转移律是不确定的,即对给定的状态和决策,下一阶段的到达状态是具有确定概率分布的随机变量,这个概率分布由本阶段的状态和决策完全确定。随机型动态规划的基本结构如下图: 图中N表示第k+1阶段可能的状态数,p1、p2、…pN为给定状态sk和决策xk的前提下,可能达到下一个状态的概率。ci为从k阶段状态sk转移到k+1 阶段状态为i时的指标函数值。 在随机性的动态规划问题中,由于下一阶段到达的状态和阶段的效益值不确定,只能根据各阶段的期望效益值进行优化。 例1 某公司承担一种新产品研制任务,合同要求三个月内交出一件合格的样品,否则将索赔2000元。根据有经验的技术人员估计,试制品合格的概率为0.4,每次试制一批的装配费为200元,每件产品的制造成本为100元。每次试制的周期为1个月。问该如何安排试制,每次生产多少件,才能使得期望费用最小?(类例教材1:例6-7) 解:把三次试制当作三个阶段(k=1,2,3),决策变量xk表示第k次生产的产品的件数;状态变量sk表示第k次试制前是否已经生产出合格品,如果有合格品,则sk=0;如果没有合格品,记sk=1。最优函数fk(sk)表示从状态sk、决策xk出发的第k阶段以后的最小期望费用。故有fk(0)=0。 生产出一件合格品的概率为0.4,所以生产xk件产品都不合格的概率为 ,至少有一件合格品的概率为1- ,故有状态转移方程为 用C(xk)表示第k阶段的费用,第k阶段的费用包 括制造成本和装配费用,故有 根据状态转移方程以及C(xk),可得到 如果3个月后没有试制出一件合格品,则要承担 2000元的罚金,因此有f4(1)=20。 当k=3时,计算如下表: 当k=2时,计算如下表: 当k=1时,有 上面三个表中并没有列出xk取更大数值的情况,因为可以证明以后的C(xk)+ fk+1(1)的值是对xk单调增加的。 因此得到的最优策略是,在第1个阶段试制2件产品;如果都不合格,在第2阶段试制3件产品;如果仍都不合格,则在第3个阶段试制5件产品。该策略得到的最小的期望费用6.46。 例2 不确定性采购问题(类例教材1:例6-8) 某厂生产上需要在近五周内必须采购一批原料,而估计在未来五周内原材料的价格是波动的,浮动价格和概率已知。如何采购使其采购价格的数学期望最小,并求出期望值。 动态规划的数学模型 该问题分成五个阶段,k表示周,k=1,2,3,4,5 设Sk表示为第k周的实际价格。 决策变量Uk,Uk=1表示为第k周决定采购,Uk=0表示为第k周决定等待。 XkE表示为第k周决定等待,而在以后采取最优决策时采购价格的期望值。 fk(Sk)表示第k周实际价格为Sk时,从第k周到第5周采取最优策略所得的最小期望值。 f5(S5)=S5 S5∈{500,600,700} f5(500)=500 f5(600)=600 f5(700)=700 即在第五周,不论原材料的市场价格如何,都必须购买。 当k=3时, f3(S3)=min{S3,X3E} X3E=0.3 f4(500)+0.3 f4(600)+ 0.4f4(700)=574 f3(500)=500 f3(600)=574 f3(700)=574 U3=1 ,当S3=500 U3=0 ,当S3=600,700 即在第三周时,当市场价格为500时,选择购买原材料。若市场价格为600或700时,则继续等待。 当k=2时, f2(S2)=min{S2,X2E} X2E=0.3 f3(500)+0.3 f3(600)+ 0.4f3(700)=551.8 f3(500)=500 f3(600)=551.8 f3(700)=551.8 U2=1 ,当S2=500 U2=0 ,当S2=600,700 即在第二周时,当市场价格为500时,选择购买原材料。若市场价格为600或700时,则继续等待。 当k=1时, f1(S1)=min{S1,X1E} X1E=0.3 f2(500)+0.3 f2(600)+ 0.4f2(700)=536.26 f1(500)=500 f1(600)=536.26 f1(700)=536.26 U1=1 ,当S1=500 U1=0 ,当S1=600,700 即在第一周时,当市场价格为500时,选择购买原材料。若市场价格为600或700时,则继续等待。 由上可知,
文档评论(0)