第6章动态规划-中国人民大学出版社.ppt

下载文档 降价啦

27
0
约4千字
约 30页
2017-04-10 发布于天津
举报
版权申诉
保障服务

第6章动态规划-中国人民大学出版社.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

管理运筹学-管理科学方法第6 章动态规划 OM:SM * * * 中国人民大学出版社谢家平编著 Sub title 学习要点理解多阶段决策问题的基本特征和阶段划分区分阶段变量、状态变量、决策变量的含义理解过程决策、状态方程、指标函数的表述理解动态规划的最优性原理和状态无后效性了解动态规划逆序求解思路和递推求解方法第6 章动态规划动态规划Dynamic Programming：多阶段决策的最优化有的管理决策问题呈现出明显的阶段性，按时序顺序或空间演变划分成多个相互联系的阶段；每个阶段的决策即为原有复杂决策的一个子问题；原有复杂决策就化为逐个求解几个简单的阶段子问题；每个阶段的决策一旦确定，整个决策过程也随之确定。例如：企业生产物流：物料供应、生产制造、分销零售等阶段物流运输配送的最短路问题：可以按空间顺序划分阶段第一节多阶段决策例：有供应商要运输一批货物去公司,试求一条运输路径最短。经过枚举计算：从始点 S1到终点ST共有3×3×2×1=18条不同路线。此问题的最短路：( → → → → )，该最短路的长度为11。 S1 ST S12 S22 S32 S13 S23 S33 S14 S24 2 4 4 7 4 3 4 3 4 5 1 5 1 4 6 3 3 3 3 4 供应商某公司出口港进口港城市阶段1 阶段2 阶段3 阶段4 第二节动态规划原理一、动态规划的基本概念阶段变量将决策全过程按时空顺序划为若干阶段用k表示阶段变量，阶段编号为顺序编号状态变量状态表示过程发展中某阶段的起始状况描述各阶段状态演进的变量，称为状态变量，用Sk表示第 k 阶段可能有若干状态，用Sk 表示阶段k的状态集合 sk(i)表示第k阶段的第 i 个状态选取的状态变量必须满足无后效性第二节动态规划原理一、动态规划的基本概念决策变量变量xk(sk)表示阶段k状态sk的决策，称为决策变量，简记xk 决策变量取值被限制在某一范围内，称允许决策集合Xk(sk) 决策变量组成的序列，称为策略全过程策略 p1,n(s1)= {x1, x2,…, xn} k子过程策略 pk,n(sk)= {xk, xk+1,…, xn} 状态转移方程下一阶段状态sk+1 是本阶段状态sk 和决策xk的函数 sk+1 =T(sk, xk(sk)) =T(sk, xk) 状态sk演进到下一阶段状态sk+1的转移规律称状态转移方程第二节动态规划原理一、动态规划的基本概念指标函数阶段指标函数vk 衡量每一阶段决策效果的优劣的数量指标是状态变量和相应决策变量的函数，即vk = vk(sk , xk ) 过程指标函数Vk,n 从第k阶段的状态sk出发到最后阶段结束的综合绩效度量取决于阶段k到阶段n所采取的策略，即Vk,n (sk,xk,xk+1 ,…,sn) 指标函数Vk,n可以是各阶段指标的和或积最优指标函数值fk(sk) 从状态sk出发，选取最优策略所得的指标函数值 fk(sk)=opt{Vk,n } 第二节动态规划原理二、动态规划的基本思路最优性原理：美国运筹学家贝尔曼提出无论过去的状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。逆序算法：逆着阶段顺序的方向，由后向前推算。各阶段求解都是在后部子过程最优策略基础上，再考虑本阶段的指标函数，求出本阶段的最优策略。阶段1 阶段2 阶段k 阶段k+1 阶段n … … 状态S1 决策 x1 状态S2 v1 决策 x2 状态S3 v2 决策 xk 状态Sk+1 vk 决策 xk+1 vk+1 决策 xn vn 寻求最优解的方向第二节动态规划原理二、动态规划的基本思路递推方程：加法合成乘法合成第二节动态规划原理三、动态规划的数学模型 1. 动态规划建模过程 2. 动态规划模型分类对问题进行阶段划分，确定阶段变量k 确定状态变量sk 确定决策变量xk 、允许决策集合Xk (sk ) 写出状态转移方程sk+1 =Tk (sk,xk) 写出指标函数的基本递推方程明确边界条件过程变量随机确定连续离散连续随机型连续确定型离散随机型离散确定型第三节逆序求解过程一、逆序标号 S1 ST S12 S22 S32 S13 S23 S33 S14 S24 2 4 4 7 4 3 4 3 4 5 1 5 1 4 6 3 3 3 3 4 供应商某公司出口港进口港城市