- 6
- 0
- 约2.4千字
- 约 28页
- 2017-04-24 发布于湖北
- 举报
第七章 动态规划;§7.1 动态规划基本原理; (3)决策和策略
当各段的状态取定以后,就可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策.表示决策的变量,称为决策变量,常用uk(sk)表示第k阶段当状态为sk时的决策变量.在实际问题中,决策变量的取值往往限制在一定范围内,称此范围为允许决策集合,常用Dk(sk)表示第k阶段从状态sk出发的允许决策集合,即uk(sk)∈Dk(sk).; 一个按顺序排列的决策组成的集合称为策略.一个n阶段决策过程,从第k阶段到第n阶段的过程称为问题的一个后部子过程,或k子过程.由k子过程的每一阶段的决策按顺序排列组成的策略序列称为k子策略,记为pk,n(sk),即
pk,n(sk)={ uk(sk), uk+1(sk+1), uk+2
(sk+2),…,un(sn)}.
当k=1时,p1,n(s1)就是全过程的一个策略.
对每个实际问题,其k子过程可供选择的策略有一定范围,称为允许策略集合,记作Pk,n,使整个问题达到最优效果的策略就是最优策略.; (4)状态转移方程
动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果.如
您可能关注的文档
最近下载
- 封面新闻笔试真题及答案2025.doc VIP
- 人教版三年级下册数学全册新质教学课件(配2026年春改版教材).pptx
- 10倍福模块介绍及使用kl3403电力测量.pdf VIP
- 精品解析:山东济南市历下区济南第一中学2025-2026学年高二4月阶段测试英语试题(原卷版).docx VIP
- 北京理工大学超星尔雅学习通“会计学”《审计学》网课试题附答案卷4.docx VIP
- 北京理工大学超星尔雅学习通“会计学”《审计学》网课试题附答案卷3.docx VIP
- 湖面漂浮物打捞湖面垃圾打捞及运输方案.docx VIP
- 北京理工大学超星尔雅学习通“会计学”《审计学》网课试题附答案卷2.docx VIP
- 北京理工大学超星尔雅学习通“会计学”《审计学》网课试题附答案卷1.docx VIP
- 北京理工大学超星尔雅学习通“会计学”《审计学》网课答卷带答案卷5.docx VIP
原创力文档

文档评论(0)