- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 33
第八章 动态规划
动态规划(Dynamic Programming,简记为DP)是运筹学的另一个重要分支,是解决多阶段决策过程最优化的一种数量化方法,是由美国数学家贝尔曼(R.Bellman)所建立.1951年他提出了解决多阶段决策问题的“最优化原理”并且研究了许多实际问题,从而创建了解决多阶段决策最优化问题的一种新的方法——动态规划(相对于它,前面讨论的规划问题称为静态规划).实践证明,D P方法在工程技术、企业管理、工农业生产及军事等部门都有广泛的应用.
动态规划的成功之处在于,它可以把一个n维决策问题变换为一个一维最优化问题,(把一个多阶段决策问题变换为一系列互相联系的单阶段问题),然后一个一个地求解,这是经典极值方法所做不到的,特别对于离散性问题,由于解析数学无法施展其术,而动态规划的方法就成为非常有用的工具.
应该指出的是动态规划是求解某类问题的一种方法,是考察问题的一种途径,而不是一种特殊的算法,它不象线性规划那样有统一的数学模型和算法(如单纯形法),而必须对具体问题进行具体分析,针对不同问题运用D P的原理和方法,建立起相应的模型,然后再用动态规划方法去求解..因此,学习动态规划时,除了要对动态规划的基本原理和方法正确理解外,还应以丰富的想象力去建立模型(数学与艺术的结晶),用灵活的技巧去求解.
§1 多阶段决策问题
在实践中,人们常会遇到这样一类决策问题,即由于过程的特殊性,可以将决策的全过程依据时间或空间划分为若干个互相联系的阶段,在每一阶段要做出决策,而一个阶段的决策,不仅影响本阶段的活动,还会影响下一阶段的活动及其决策,从而影响整个决策过程.各个阶段的决策,构成一个决策序列,称为一个策略,由于每一阶段常有很多方案可供选择,因此,每一阶段也能作出若干不同的决策.这样各阶段的各自很多不同决策就构成了许多不同的策略.由于每阶段的不同决策其效果是不同的.因而由此所构成的不同策略的效果一般也不同,那么在诸多可供选择的策略中,选择哪一策略才能使一项待行的活动取得最佳效果?这类问题就是多阶段决策问题.
例8.1 100多年前,有位美国推销员乘驿站马车,经过不友好的印地安地区向东旅行,虽然他的起点州A(state ,状态)和目的地州E是固定的,但在途中要走过哪些州,却有相当大的选择余地.如图8-1所示:
2C1
2
C1
B1
6442D1
6
4
4
2
D1
343674
3
4
3
6
7
4
2343AEC2B2
2
3
4
3
A
E
C2
B2
431D2
4
3
1
D2
35
3
5
C3B
C3
B3
1 2 3 4
图8-1 旅行线路图
他从州A出发,旅行至州E目的地,需要4个驿程(stage,阶段),而从第1天开始每天都有不同的选择,此推销员是一个谨慎的人,十分关心他这次旅行中的安全,在经过一番思考后,他想到一个相当巧妙的办法来确定他的最安全途径,人身保险当时是很欢迎驿站乘客投保的,因为每张保险单(policy,策略)的收费是考虑了该行程的安全程度后订出的,所以最安全的途径应当是人身保险单最低廉的途径,设州i至州j的行程上,保险费记cij,如图8-1所示.问题为求从 State A到 State E走哪条途径使保险单的总费用达到最小?(如果把cij看成是距离,则问题是求A?E的最短路)这是一个典型的多阶段决策问题.
值得注意的是,作出各相继驿程上最佳决策.不一定产生总的最佳决策(即Greedy算法未必取得最佳策略).
如 A 2 B1 4 C2 3 D2 4 E 费用和为13
而 A 3 B3 1 C2 更低廉
求解该问题可以有以下两种思路:
方法一:穷举法
即列出所有的可行路径,逐个路径进行比较,并从中选出最佳路径.
对于例8-1,分为4个阶段:
A B ( B1 , B2 , B3 )为第一阶段;3条路
B C ( C1 , C2 , C3 )为第二阶段;3条路
C D ( D1 , D2 )为第三阶段; 2条路
D E 为第四阶段;1条路
从而所有的可行路径共有 3×3× 2 × 1=18
最短路径为 A 3 B3
您可能关注的文档
- 宾馆前台境外登记学习材料,(不可删除).doc
- 滨河小学学生肥胖的综合干预方案.doc
- 丙乳砂浆施工作业指导书(第一版).docx
- 病理生理学炎症概论.ppt
- 亳州职业职业技术学院学生顶岗实习安排表.doc
- 博士德研讨会总经理如何 打造团队领袖.ppt
- 博雅幼儿园夏季一周食谱(9月26日--9月30日).doc
- 渤海钻探泥浆技术服务分公司形势任务教育材料.doc
- 部门周、月、年工作计划.ppt
- 财务案例分析作业.doc
- 专卖店促销员销售与成交技巧培训课件(34P).pptx
- 红色商务风新员工入职销售技巧知识培训课件(34P).pptx
- 专卖店商场销售员销售与成交技巧培训课件(34P).pptx
- 小区物业保安法律知识培训课件(28P).pptx
- 专卖店销售员轻松成交技巧培训(34P).pptx
- 轻松成交客户新员工入职通用销售技巧知识培训(34P).pptx
- 2024年初级《银行业法律法规与综合能力》考前必刷必练题库500题(含真题、必会题).docx
- 2024年“新安法知多少”知识竞赛题库及答案(最新版).docx
- 2024年30秒毕业生面试工作自我介绍.docx
- 2024年《医务人员礼仪培训》心得体会.docx
文档评论(0)