- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
h62[管理学]运筹学 动态规划
第七章 动态规划 动态规划简介 多阶段决策过程最优化 动态规划的基本概念 基本概念(续一) 基本概念(续二) 基本概念(续三) 基本概念(续四) 基本概念(续五) 最短路线问题的解 动态规划的最优化原理 最短路线问题的标号法 最短路线问题的标号法(续) * 多阶段决策过程,是指一类特殊的过程,它们可以按时间顺序分解成若干个相互联系的阶段,称为“时段”,在每个时段都要做决策,全部过程的决策是一个决策序列。多阶段决策问题也称为序贯决策问题。 多阶段决策问题的目标是要达到整个活动过程的总体最优。在每个阶段进行决策时不应仅考虑本阶段最优,尤其应考虑对最终目标的影响,从而做出对全局来说最优的决策。 动态规划是符合这种要求的一种决策方法。 第 1 阶段 第 2 阶段 第 n阶段 决策 决策 决策 多阶段决策过程图示 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4 3 阶段: k=1,2,3,4,5 1 2 3 4 5 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4 3 状态:各阶段开始时的客观条件。表示状态的变量称为状态变量,常用sk表示第k阶段的状态变量,第k阶段所有状态变量的集合记为Sk。动态规划考虑的状态应该具有“无后效性” 决策:当一个阶段的状态取定了后,就可以作出不同决定(或选择),从而确定下一阶段的状态,这种决定称为决策。 表示决策的变量称为决策变量,uk(sk)就表示第k阶段当状态为sk时的决策变量。 决策变量的取值常常限制在一定的范围内,这一范围称为允许决策集合,常用记号Dk(sk)表示第k阶段状态为sk时的允许状态集合。 各阶段的决策确定后,整个过程各阶段的决策就构成一个决策序列,称为策略,用p1,n{u1(s1), u2(s2), …, un(sn)}表示。 此外还常常需要考虑后部子策略pk,n{uk(sk), …, un(sn)}。 动态规划要求的就是使整个问题达到最优的策略。 状态转移方程:动态规划中一个阶段的状态常常是上一阶段的状态和决策的结果。如果给定了第k阶段的状态sk,和第k阶段的决策uk(sk),则第k+1阶段的状态sk+1也就完全确定了,这一关系可用下面的方程表示 sk+1=Tk(sk, uk) 称之为状态转移方程,它表示了由第k阶段到第k+1阶段状态转移的规律 指标函数:用于衡量决策或策略优劣的数量指标称为指标函数。 阶段指标函数:它通常是指在第k阶段,从状态sk出发,采用决策uk时的效益,记为d(sk, uk)。 过程指标函数:它通常表示在第k阶段时的状态为sk时,采用后部子策略pk,n的效益值,记为Vk,n(sk, pk,n)。最优指标函数记为fk(sk),表示第k阶段的状态为sk时,采用了最优后部子策略p*k,n的指标函数值, Vk,n(sk, pk,n)与fk(sk)的关系是 特别地,f1(s1)就是从初始状态s1到全过程结束的整体最优函数。 对最短路线问题阶段指标函数就是两点间的距离。后部子过程pk,n的指标函数Vk,n(sk, pk,n)就是在第k阶段位于点sk时到终点的距离,而fk(sk)就是到终点的最短距离。 最短路线问题,就是要求f1(A)以及相应的路线。 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4 3 第一步,从k=5开始,状态变量s5可以取两种状态E1,E2,从它们到终点F的距离分别为4,3。即 f5(E1)=4, f5(E2)=3 动态规划最通常的解法,就是逆序递推的方式求解。 第二步,k=4,状态变量s4可以取三个值D1,D2,D3。于是 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4 3 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4 3 k=3 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4 3 k=2 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 F 4 5 2 3 6 8 7 7 5 8 4 5 3 4 8 4 3 5 6 2 1 3 4
您可能关注的文档
- 3xv[高考理综]历年高考考模式下考模式下物理学科复习的几点思考.doc
- hkb[其他资格考试]6S的内容.doc
- 590[高二政史地]21 我国自然灾害的特点与分布课件.ppt
- vs7[高三理化生]高中生物基因工程的应用 同步测试人教版选修三.doc
- 6hd[计算机]巧妙挖掘网站长尾关键词.doc
- m5l[思想汇报]百万富翁.doc
- 9gj[中学教育]计算机应用基础.ppt
- onr[应用文书]新闻写作讲座.ppt
- 47w[高一数学]《名师伴你行》人教A版数学必修五第一章学案3 应用举例.ppt
- d9k[初三政史地]承担关爱集体的责任.ppt
- 浙江台州玉环市司法局招聘两名驾驶员笔试模拟试题带答案详解.docx
- 浙江宁波市镇海区市场监管局劳务派遣用工招聘笔试模拟试题及答案详解一套.docx
- 新疆第二师疾病预防控制中心面向高校毕业生招聘笔试备考题库及参考答案详解1套.docx
- 江苏苏州市立达中学教育集团赴高校招聘2025年应届优秀毕业生10人笔试模拟试题及参考答案详解一套.docx
- 广州海洋地质调查局2024年度公开招聘第二批社会在职人员的笔试模拟试题及答案详解一套.docx
- 浙江清华长三角研究院招聘工作人员笔试备考题库带答案详解.docx
- 江苏苏州大学纳米科学技术学院课程助教招聘11人(2024-2025-2学期)笔试模拟试题及参考答案详.docx
- 浙江宁波北仑区市场监督管理局信用监管科招聘编外人员笔试模拟试题及参考答案详解1套.docx
- 江苏省文化艺术研究院招聘工作人员4人笔试模拟试题含答案详解.docx
- 浙江中医药大学教学管理岗位劳务派遣人员招聘笔试模拟试题及参考答案详解1套.docx
文档评论(0)