動态规划及其在资源分配中的应用.docVIP

下载本文档

3
0
约5千字
约 5页
2016-11-27 发布于重庆
举报
版权申诉

動态规划及其在资源分配中的应用.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

動态规划及其在资源分配中的应用

动态规划及其在资源分配中的应用摘要：在概述动态规划原理的基础上，提出了动态规划的数学模型建模的主要步骤，将动态规划思想运用到求解资源分配中，并通过一个实际应用例子具体说明动态规划如何解决资源分配问题。关键词：动态规划，资源分配动态规划是运筹学的一个分支，它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼（R..Bellman）等人，根据一类多阶段决策问题的特点，把多阶段决策问题变换为一系列相互联系的单阶段问题，然后逐个加以解决。与此同时，他提出了解决这类问题的“最优性原理”，研究了许多实际问题，从而创建了解决最优化问题的一种新的方法——动态规划。动态规划的方法，在工程技术、企业管理、工农业生产及军事部门中都有广泛的应用，并且获得了显著的效果。在企业管理方面，动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存问题、装载问题、排序问题、设备更新问题、生产过程最优控制问题等等，所以它是现代企业管理中的一种重要的决策方法。许多问题用动态规划的方法去处理，常比线性规划或非线性规划更有成效。特别对于离散性的问题，由于解析数学无法施展其术，而动态规划的方法就成为非常有用的工具。应指出，动态规划是求解某类问题的一种方法，是考查问题的一种途径，而不是一种特殊算法（如线性规划是一种算法）。因而，它不像线性规划那样有一个标准的数学表达式和明确定义的一组规则，而必须对具体问题进行具体分析处理。 1、动态规划原理概述动态规划最优化原理可以这样阐述：一个最优化策略不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略，即其子策略总是最优的。任何思想方法都有一定的局限性，动态规划也有其适用的条件。如果某阶段的状态给定后，则在这阶段以后过程的发展不受这阶段以前各段状态的影响，这个性质称为无后效性，适用动态规划的问题必须满足这个性质；其次还须满足上述最优化原理。动态规划基本思想一是正确地写出基本的递推关系式和恰当的边界条件；二是在多阶段决策过程中，动态规划方法是既把当前一段和后来各阶段分开，又把当前效益和未来效益结合起来考虑的一种多阶段决策的最优化方法。每阶段决策和选取是从全局来考虑的，与该段的最优选择的答案一般是不同的；三是在求整个问题的最优策略时，由于初始状态是已知的，而每阶段的决策又都是该阶段状态的函数，因而最优策略所经过的各阶段状态便可逐次变换得到，从而确定最优路线。简言之，动态规划的基本思想就是把全局的问题化为局部的问题，为了全局最优必须局部最优。 2、动态规划建模主要步骤用动态规划求解实际问题，首先要建立动态规划模型，需进行以下的基本步骤：第一步：正确划分阶段，确定阶段变量。将多阶段决策问题的实际过程，恰当地划分为若干个相互独立又相互联系的部分，每一个部分为一个阶段，划分出的每一个阶段通常就是需要做出一个决策的子问题。阶段通常是按决策进行的时间或空间上的先后顺序划分的，阶段变量用k表示。第二步：确定状态，正确选择状态变量。在多阶段决策过程中，状态是描述研究问题过程的状况，表示每个阶段开始时所处的自然状况或客观条件。一个阶段有若干个状态，用一个或一组变量来描述，状态变量必须满足两个条件：一是能描述过程的演变；二是满足无后效性。用Sk表示第k个阶段的状态变量。第三步：正确选择决策变量及允许的决策集合。决策的实质是关于状态的选择，是决策者从给定阶段状态出发对下一阶段状态作出的选择，而在实际问题中，决策变量的取值往往限制在某一范围内，此范围称之为允许决策集合。决策变量用Uk表示；允许的决策集合是决策变量的取值范围用 Dk(sk)表示。第四步：写出状态转移方程。状态转移方程的一般形式为Sk+1=Tk(sk,uk),这里的函数关系T因问题的不同而不同，如果给定第k个阶段的状态变sk，则该阶段的决策变量uk一经确定，第k+1阶段的状态变量sk+1的值也就可以确定。第五步：列出指标函数。根据题意写出指标函数，指标函数常用 Vk,n表示.即 Vk,n=Vk,n(sk,uk,sk+1,……,sn+1)，k=1,2,……，n. 它应满足以下三个性质： i它是定义在全过程及所有后部子过程上的数量函数； ii具有可分离性，且满足递推关系，即 Vk,n=Q(sk,uk,Vk+1,n)； iii函数 Q(sk,uk,Vk+1,n)关于变量Vk+1，n 要严格单调。第六步：写出动态规划函数基本方程，用fk(sn+1)表示k---n阶段的最优策略函数： fn+1(xn+1)=0 fk(s