- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
动态规划程序
function
[p_opt,fval]=dynprog(x,DecisFun,SubObjFu
n,TransFun,ObjFun)
% x为状态变量,一列代表一个阶段的状态
% M_函数DecisFun(k,x)表示由阶段k的状态值x求出
相应的允许决策集合
% M_函数SubObjFun(k,x,u)表示阶段k的指标函数
% M_函数TransFun(k,x,u)是状态转移函数,其中x
是阶段k的状态值,u是其决策集合
% M_函数ObjFun(v,f)是第k阶段到最后阶段的指标
函数,当ObjFun(v,f)=v+f时,输入ObjFun(v,f)
可以省略
% 输出p_opt由4列组成,p_opt=[序号组,最优轨线组,
最优策略组,指标函数值组];
% 输出fval是列向量,各元素分别表示p_opt各最优策
略组对应始端状态x的最优函数值
k=length(x(1,:)); % k为阶段数
x_isnan=~isnan(x);
t_vubm=inf*ones(size(x)); % t_vubm为指标
函数值的上限
f_opt=nan*ones(size(x));
% f_opt为不同阶段、状态下的最优值矩阵,初值
为非数
d_opt=f_opt; % d_opt为不同阶段不同状态下
的决策矩阵,初值为非数
tmp1=find(x_isnan(:,k)); % 找出第k阶段
状态值(不是非数)的下标
tmp2=length(tmp1);
for i=1:tmp2
u=feval(DecisFun,k,x(tmp1(i),k));
% 求出相应的允许决策向量
tmp3=length(u);
for j=1:tmp3 % 该for语句是为了求
出相应的最有函数值以及最优决策
tmp=feval(SubObjFun,k,x(tmp1(i),k),u(j))
;
if tmp=t_vubm(i,k)
f_opt(tmp1(i),k)=tmp;
d_opt(tmp1(i),k)=u(j);
t_vubm(i,k)=tmp;
end
end
end
for ii=k-1:-1:1
% 从后往前面递推求出f_opt 以及d_opt
tmp10=find(x_isnan(:,ii));tmp20=length(t
mp10);
for i=1:tmp20
u=feval(DecisFun,ii,x(tmp10(i),ii));
tmp30=length(u);
for j=1:tmp30
tmp00=feval(SubObjFun,ii,x(tmp10(i),ii),
u(j));
tmp40=feval(TransFun,ii,x(tmp10(i),ii),u
(j));
% 由该状态值及相应的决策值求出下一阶段的状态值
tmp50=x(:,ii+1)-tmp40;
tmp60=find(tmp50==0);
% 找出下一阶段的状态值在x(:,ii+1)的下标
if ~isempty(tmp60)
if nargin5
tmp00=tmp00+f_opt(tmp60(1),ii+1);
else
tmp00=feval(ObjFun,tmp00,f_opt(tmp60(1),
ii+1));
end
if tmp00=t_vubm(i,ii)
f_opt(tmp10(i),ii)=tmp00;d_opt(i,ii)=u(j)
;
t_vubm(tmp10(i),ii)=tmp00;
end
end
end
end
end
fval=f_opt(find(x_isnan(:,1)),1);
% fval即为最有函数值矩阵
p_opt=[];tmpx=[];tmpd=[];tmpf=[];
tmp0=find(x_isnan(:,1));tmp01=length(tmp
0);
for i=1:tmp01
tmpd(i)=d_opt(tmp0(i),1);
% 求出第一阶段的决策值
tmpx(i)=x(tmp0(i),1);
% 求出第一阶段的状态值
tmpf(i)=feval(SubObjFun,1,tmpx(i),tm
pd(i));
% 求出第一阶段的指标函数值
p_opt(k*(i-1)+1,[12 3 4])=
[1,tmpx(i),tmpd(i),tmpf(i)];
for ii=2:k % 按顺序求出各
阶段的决策值、状态值以及指标函数值
tmpx(i)=feval(TransFun,ii-1,tmpx(i),tmpd
(i));
tmp1=x(:,ii)-tmpx(i);tmp2=find(tmp1==0);
if ~isempty(tmp2)
tmpd(i)=d_opt(tmp2(1),ii);
end
tmpf(
原创力文档


文档评论(0)