- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
运筹学第七章课件.ppt
深圳大学管理学院 Yunchouxue 第七章 动态规划 以最短路问题为例,来说明动态规划的概念 一、动态规划基本概念: 1、阶段: 将所要研究的问题,按时间或空间特征分成若干个互相联系的阶段.简称“阶段”。 阶段就是作出决策的若干轮次。描述阶段的变量叫阶段变量,常用k表示阶段变量.上例中k=1,2,3,4,5。 2、状态及性质 各阶段开始时的客观条件叫做状态.描述各阶段状态的变量叫做状态变量,常用sk表示第k阶段的状态变量, sk的取值集合称为状态集合,用Sk表示。 阶段的出发位置,即阶段的起点。 上例中,第二阶段有两个状态,即Sk= {B1,B2} 动态规划中状态具有以下性质:某阶段状态一旦确定,以后过程的状态变化不受这个状态以前的影响,也就是说某状态以后的过程和以前无关,只与当前状态有关,我们称这种特性为“无后效性.”(即马尔科夫性。)P194 3、决策和策略 指从一个阶段某状态演变到下一阶段某状态的选择(决定)称为决策。 表示决策的变量叫做决策变量,常用uk(sk)表示.第k阶段当状态为sk时的决策变量. 在实际问题中决策变量的取值往往限制在一定的范围内,我们称此范围为允许决策集,常用Dk(sk)表示第k阶段从状态sk出发的允许决策集,因此有uk(sk) ∈Dk(sk). 在例1中D2(B1)={C1,C2,C3} . 策略 在例1中 D2(B1)={C1,C2,C3}.表示什么? 表示从第二阶段的状态B1出发,可选择下一阶段的{C1 ,C2,C3}。即允许决策集是D2(B1).如果我们决策选择了C3,则u2(B1)=C3. 全过程中各个阶段的决策组成的有序总体称为策略。 上例中每一条路线都被称为一个策略。 使整个问题达到最优效果的策略就是最优策略.即上例中,路最短的策略就是最优策略。 状态转移方程 动态规划中本阶段的状态是上一阶段的决策结果.如果给定了第k阶段的状态sk,本阶段的决策就为uk(sk),则第k+1段的状态uk+1也就完全确定了,它们的关系可表示为:sk+1=Tk(sk,uk).由于它表示了由k到k+1段的状态转移规律,所以称为状态转移方程. 即前一阶段的终点(决策)是后一阶段的起点(状态)。 例1的转移方程为:sk+1 =Tk(sk,uk) =uk(sk). 指标函数 用于衡量所选定策略优劣的数量指标称为指标函数. 一个n段决策过程,从1到n叫作问题的全过程,对于任意一个给定的k ,从第k 到n段的过程称为全过程的一个后部子过程.指标函数是定义在全过程和后部子过程上确定的数量函数。常用Vk,n表示, 即Vk,n= Vk,n(sk, uk, sk+1,… sn+1),k=1,2,…n 指标函数的最优值称为最优指标函数,记为fk(sk),它表示从第k阶段状态sk开始到第n阶段的终止状态的过程,采取最优策略所得到的指标函数值。即fk(sk)=optVk,n(sk,pk,n), fk(sk)可能是最大值,也可能是最小值,依题意而定。 当k=1时F1(s1)就是从初始状态到全过程的整体最优函数. 指标函数的常见形式: (1)过程和它的任一子过程的指标是它所包含的各阶段的指标的和。 (2)过程和它的任一子过程的指标是它所包含的各阶段的指标的乘积。 指标函数应具有可分离性,并满足递推关系。vj(sj,uj)表示第j阶段的指标,则1,2式分别写为: Vk,n(sk, uk, sk+1,… sn+1)= vk(sk,uk)+ Vk+1,n(sk+1, uk+1, sk+2,… sn+1) Vk,n(sk, uk, sk+1,… sn+1)= vk(sk,uk) Vk+1,n(sk+1, uk+1, sk+2,… sn+1) 回到例1 在例1中 指标函数是距离.如第2阶段,状态为B1时,V2,5(B1)表示从B1到F的距离,而f2(B1)则表示从B1到 F的最短距离. 该问题总目标是求f1(A),即从A到终点F的最短距离. ⑴阶段 从网络图中可看到问题可分为k=5段. ⑵状态 由A-F分为5段,存在6种状态允许集:S1-S6 S1={A},S2={B1,B2}, S3={C1,C2,C3,C4}, S4={D1,D2,D3}, S5={E1,E2}, S6={F} ⑶例1中的决策允许集 D1(A)={B1,B2} D2(B1)={C1,C2,C3} D2(B2)={C2,C3,C4} D3(C1)={D1,D2}, …D3(C4)=? D4(D1)={E1,E2},D4(D2)= {E1,E2} D5(E1)={F}, D5(E2)={F} ⑷状态转移方程 例1中的状态转移方程sk+1=uk(sk) 如: s3=u
您可能关注的文档
- 软件开发流程及规范课件.ppt
- 软件开发流程课件.ppt
- 软件开发英语总汇课件.ppt
- 软件技术基础》第五章QI课件.ppt
- 软件技术基础之指针和结构体课件课件.ppt
- 软件技术基础总复习课件.ppt
- 软件无线电课件.ppt
- 软件架构设计教程课件.ppt
- 软件测试基础和入门课件.ppt
- 软件测试等级-系统验收课件.ppt
- CNAS-CL63-2017 司法鉴定-法庭科学机构能力认可准则在声像资料鉴定领域的应用说明.docx
- 12J7-3 河北《内装修-吊顶》.docx
- 12N2 河北省12系列建筑标准设计图集 燃气(油)供热锅炉房工程.docx
- 内蒙古 12S8 排水工程 DBJ03-22-2014.docx
- 山西省 12S10 12系列建筑标准设计 管道支架、吊架.docx
- 16J601-木门窗标准图集.docx
- 12J8 河北省12系列《 楼梯》.docx
- CNAS-GL37 2015 校准和测量能力(CMC)表示指南.docx
- CNAS-RL02-2016 能力验证规则.docx
- 津02SJ601 PVC塑料门窗标准.docx
最近下载
- 2024年广州市高三二模(普通高中毕业班综合测试(二)数学试卷(含官方答案及逐题解析).pdf
- 武汉市2025届高中毕业生四月调研考试(四调)数学试卷(含答案详解).pdf
- (毕业论文)果树采摘机器人的发展现状及运动学分析.doc VIP
- 【高中语文】双新背景下的语文教学设计+85.pptx VIP
- 雨课堂学堂在线《兵棋(中国人民武装警察部队警官学院)》学堂云单元测试考核答案.pdf VIP
- 11.3 一元一次不等式组(教学设计)七年级数学下册(人教版2024).docx
- 年产1万吨一氯甲烷的工艺流程设计.doc
- 医疗器械质量管理制度-全套规章制度.docx VIP
- 木材质量v验收标准.doc
- 直肠癌(外科学课件).ppt VIP
文档评论(0)