动态规划程序.docVIP

下载本文档

11
0
约2.54千字
约 7页
2018-04-27 发布于河南
举报
版权申诉

动态规划程序.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态规划程序

function [p_opt,fval]=dynprog(x,DecisFun,SubObjFu n,TransFun,ObjFun) % x为状态变量，一列代表一个阶段的状态 % M_函数DecisFun（k,x)表示由阶段k的状态值x求出相应的允许决策集合 % M_函数SubObjFun（k,x,u)表示阶段k的指标函数 % M_函数TransFun（k,x,u)是状态转移函数，其中x 是阶段k的状态值，u是其决策集合 % M_函数ObjFun（v,f)是第k阶段到最后阶段的指标函数，当ObjFun（v,f)=v+f时，输入ObjFun（v,f) 可以省略 % 输出p_opt由4列组成，p_opt=[序号组，最优轨线组，最优策略组，指标函数值组]; % 输出fval是列向量，各元素分别表示p_opt各最优策略组对应始端状态x的最优函数值 k=length(x(1,:)); % k为阶段数 x_isnan=~isnan(x); t_vubm=inf*ones(size(x)); % t_vubm为指标函数值的上限 f_opt=nan*ones(size(x)); % f_opt为不同阶段、状态下的最优值矩阵，初值为非数 d_opt=f_opt; % d_opt为不同阶段不同状态下的决策矩阵，初值为非数 tmp1=find(x_isnan(:,k)); % 找出第k阶段状态值（不是非数）的下标 tmp2=length(tmp1); for i=1:tmp2 u=feval(DecisFun,k,x(tmp1(i),k)); % 求出相应的允许决策向量 tmp3=length(u); for j=1:tmp3 % 该for语句是为了求出相应的最有函数值以及最优决策 tmp=feval(SubObjFun,k,x(tmp1(i),k),u(j)) ; if tmp=t_vubm(i,k) f_opt(tmp1(i),k)=tmp; d_opt(tmp1(i),k)=u(j); t_vubm(i,k)=tmp; end end end for ii=k-1:-1:1 % 从后往前面递推求出f_opt 以及d_opt tmp10=find(x_isnan(:,ii));tmp20=length(t mp10); for i=1:tmp20 u=feval(DecisFun,ii,x(tmp10(i),ii)); tmp30=length(u); for j=1:tmp30 tmp00=feval(SubObjFun,ii,x(tmp10(i),ii), u(j)); tmp40=feval(TransFun,ii,x(tmp10(i),ii),u (j)); % 由该状态值及相应的决策值求出下一阶段的状态值 tmp50=x(:,ii+1)-tmp40; tmp60=find(tmp50==0); % 找出下一阶段的状态值在x(:,ii+1)的下标 if ~isempty(tmp60) if nargin5 tmp00=tmp00+f_opt(tmp60(1),ii+1); else tmp00=feval(ObjFun,tmp00,f_opt(tmp60(1), ii+1)); end if tmp00=t_vubm(i,ii) f_opt(tmp10(i),ii)=tmp00;d_opt(i,ii)=u(j) ; t_vubm(tmp10(i),ii)=tmp00; end end end end end fval=f_opt(find(x_isnan(:,1)),1); % fval即为最有函数值矩阵 p_opt=[];tmpx=[];tmpd=[];tmpf=[]; tmp0=find(x_isnan(:,1));tmp01=length(tmp 0); for i=1:tmp01 tmpd(i)=d_opt(tmp0(i),1); % 求出第一阶段的决策值 tmpx(i)=x(tmp0(i),1); % 求出第一阶段的状态值 tmpf(i)=feval(SubObjFun,1,tmpx(i),tm pd(i)); % 求出第一阶段的指标函数值 p_opt(k*(i-1)+1,[12 3 4])= [1,tmpx(i),tmpd(i),tmpf(i)]; for ii=2:k % 按顺序求出各阶段的决策值、状态值以及指标函数值 tmpx(i)=feval(TransFun,ii-1,tmpx(i),tmpd (i)); tmp1=x(:,ii)-tmpx(i);tmp2=find(tmp1==0); if ~isempty(tmp2) tmpd(i)=d_opt(tmp2(1),ii); end tmpf(