- 1、本文档共70页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
動態規劃;動態規劃是貝爾曼(Bellman)在五十年代為解決多級決策過程而提出來的。它可以解決很多領域中的問題,如生產過程的決策,收益和投資問題,有多級反應器的化工裝置的設計,多級軋鋼機的最速軋製問題,資源分配、機器負荷分配、生產計畫編制,特別是控制工程問題。;它和極小值原理一樣,可解決控制變數受約束的最優控制問題,而且在這兩種方法之間存在某種內在的聯繫。動態規劃的中心思想是利用所謂“最優性原理”,把一個級決策過程化為個單級決策過程,從而使問題簡單。;6.1多級決策的例子——最短時間問題
;;(一)窮舉法
;路線行車時間(小時)
13
11
14
13
12
9;這裏每條路線由四段組成,也可以說是四級決策。
為了計算每條路線所花時間,要做三次加法運算,為了計算六條路線所花的時間要作3×6=18次運算。這種方法稱為“窮舉法”。
顯然當段數很多時,計算量是很大的。這種方法的特點是從起點站往前進行,而且把這四級決策一起考慮。應注意從到下一站所花的時間為1,而到所花時間為3,但最優路線卻不經過。
這說明只看下一步的“眼前利益”來作決策是沒有意義的。;(二)動態規劃法;令為決策(控制)變數,它表示當處在位置而還有段要走時,所要選取的下一點。
例如,從出發,下一點為時,則表示為
。;;1(倒數第一段)
;2(倒數第二段);;3(倒數第三段);;4(倒數第四段);;;;;6.2最優性原理
;;;;最優性原理可表示為;;;;6.3用動態規劃解資源分配問題
;;;;容易看出,函數有下列性質;這些性質構成了以後解題的邊界的條件。;;例1-1;;解
由邊界條件知。現在慮,它表示用1個單元資源分配到2個產品上的最大收益。表示投入第2個產品的資源,則可取值1或0,對應地將有下表。;;根據(6-10)式可得;同理,當可取值3,2,1,0時可求得;再考慮3個產品的資源分配,可得這三個產品投入資源的單元數為1,2,3,4時的,最優值如下;;6.4用動態規劃求離散最優控制
;尋找最優控制序列使最小,這正是多級決策問題,利用最優性原理,根據遞推方程(6-2),從最後一步開始,逐步求出。下麵用例子來說明求解過程。;例6-2;解先考慮最後一步,即從到。這時由(6-13)、(6-14)式得;將代入和可得,相應於上面最優控制的性能指標與最優狀態轉移為;求;;6.5連續系統的動態規劃
;設時間在區間內,則根據最優性原理,從
到這一段過程應當是最優過程。把這段最優指標寫成,則;現在,考慮系統從出發,到分兩步走:先從到,再從到,是小量,則;;注意到,上式右邊括弧中表示最優指標,其中為最優控制,不需再選擇,也與選擇無關。故;引用以前使用過的哈密頓函數
;(6-25)或(6-28)稱為哈密頓—雅可比—貝爾曼方程,邊界條件是(6-22)式。哈密頓—雅可比—貝爾曼方程在理論上很有價值,但它是的一階偏微分方程並帶有取極小的運算,因此求解是非常困難的,一般情況得不到解析解,只能用電腦求數值解。對於線性二次問題,可以得到解析解,而且求解結果與用極小值原理或變分法所得結果相同。這時,哈密頓——雅可比——貝爾曼方程可
文档评论(0)