- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
运筹学-
精品课程《运筹学》 第二节 动态规划问题的基本要素和最优化原理 §2.1 动态规划的基本概念 §2.2 动态规划的基本思想 §2.3 建立动态规划模型的步骤 精品课程《运筹学》 1、阶段: 把一个问题的过程,恰当地分为若干个相互联系的阶段,以便于按一定的次序去求解。 描述阶段的变量称为阶段变量。阶段的划分,一般是根据时间和空间的自然特征来进行的,但要便于问题转化为多阶段决策。 2、状态:表示每个阶段开始所处的自然状况或客观条件。通常一个阶段有若干个状态,描述过程状态的变量称为状态变量。 年、月、路段 一个数、一组数、一个向量 状态变量的取值有一定的允许集合或范围,此集合称为状态允许集合。 §2.1 动态规划的基本概念 精品课程《运筹学》 3、决策:表示当过程处于某一阶段的某个状态时,可以作出不同的决定,从而确定下一阶段的状态,这种决定称为决策。 描述决策的变量,称为决策变量。决策变量是状态变量的函数。可用一个数、一组数或一向量(多维情形)来描述。 在实际问题中决策变量的取值往往在某一范围之内,此范围称为允许决策集合。 系统在某一阶段的状态转移不但与系统的当前的状态和决策有关,而且还与系统过去的历史状态和决策有关。 4、多阶段决策过程 可以在各个阶段进行决策,去控制过程发展的多段过程; 其发展是通过一系列的状态转移来实现的; 精品课程《运筹学》 图示如下: 状态转移方程是确定过程由一个状态到另一个状态的演变过程。如果第k阶段状态变量sk的值、该阶段的决策变量一经确定,第k+1阶段状态变量sk+1的值也就确定。 其状态转移方程如下(一般形式) 1 2 k ? s1 u1 s2 u2 s3 sk uk sk+1 能用动态规划方法求解的多阶段决策过程是一类特殊的多阶段决策过程,即具有无后效性的多阶段决策过程。 S为状态,u为时刻。 因为sk跟之前的k-1个s相关,所以sn+1可以刻画为仅与sn与uk有关 精品课程《运筹学》 如果状态变量不能满足无后效性的要求,应适当地改变状态的定义或规定方法。 动态规划中能 处理的状态转移 方程的形式。 状态具有无后效性的多阶段决策过程的状态转移方程如下 无后效性(马尔可夫性) 如果某阶段状态给定后,则在这个阶段以后过程的发展不受这个阶段以前各段状态的影响; 过程的过去历史只能通过当前的状态去影响它未来的发展; 构造动态规划模型时,要充分注意是否满足无后效性的要求; 状态变量要满足无后效性的要求; 方程对于无后效性的问题改写为sk+1=(sk,uk) 精品课程《运筹学》 5、策略:是一个按顺序排列的决策组成的集合。在实际问题中,可供选择的策略有一定的范围,称为允许策略集合。从允许策略集合中找出达到最优效果的策略称为最优策略。 6、状态转移方程:是确定过程由一个状态到另一个状态的演变过程,描述了状态转移规律。 7、指标函数和最优值函数:用来衡量所实现过程优劣的一种数量指标,为指标函数。指标函数的最优值,称为最优值函数。在不同的问题中,指标函数的含义是不同的,它可能是距离、利润、成本、产量或资源消耗等。 动态规划模型的指标函数,应具有可分离性,并满足递推关系。 可分离性:也就是指支持阶段的划分 f=f1(x1) o f2(x2)... o fn(xn) (o为某种确定的运算) 精品课程《运筹学》 小结: 方程 :状态转移方程 概念 : 阶段变量k﹑状态变量sk﹑决策变量uk; 指标: 动态规划本质上是多阶段决策过程; 效益 指标函数形式: 和、 积 无后效性 可递推 精品课程《运筹学》 解多阶段决策过程问题,求出 最优策略,即最优决策序列 f1(s1) 最优轨线,即执行最优策略时的状态序列 最优目标函数值 从 k 到终点最优策略 子策略的最优目标函数值 精品课程《运筹学》 1、动态规划方法的关键在于正确地写出基本的递推关系式和恰当的边界条件(简称基本方程)。要做到这一点,就必须将问题的过程分成几个相互联系的阶段,恰当的选取状态变量和决策变量及定义最优值函数,从而把一个大问题转化成一组同类型的子问题,然后逐个求解。即从边界条件开始,逐段递推寻优,在每一个子问题的求解中,均利用了它前面的子问题的最优化结果,依次进行,最后一个子问题所得的最优解,就是整个问题的最优解。 §2.2 动态规划的基本思想 转化为同类型的子问题然后逐个求解 精品课程《运筹学》 2、在多阶段决策过程中,动态规划方法是既把当前一段和未来一段分开,又把当前效益和未来效益
您可能关注的文档
最近下载
- 1.1_犬的起源、进化与特征.ppt VIP
- 2024高考语文考前精刷卷专题十四文学类文本阅读散文.docx VIP
- 大学语文之诗经电子教案.doc VIP
- 高校生活超市和24小时便利店租赁经营投标常用方案(最全).doc VIP
- 15J001 围墙大门图集标准.docx VIP
- 双向搅拌桩加固高速公路软土地基现场对比试验研究.pdf VIP
- 铁道概论:铁路信号和通信PPT教学课件.pptx VIP
- 《医学微生物学》课件——细菌的形态与结构.ppt VIP
- 贵州丹寨金汞矿日处理500吨(一期250吨)金汞原矿浮选生产线技改项目环境影响报告书.pdf VIP
- 大一新生班干部竞选演讲稿PPT.pptx VIP
文档评论(0)