《数学建模与数据学实验》课件第5章.ppt

下载文档

1
0
约1.35万字
约 193页
2024-09-07 发布于广东
举报
版权申诉
保障服务

《数学建模与数据学实验》课件第5章.ppt

1、本文档共193页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

式（5.12）通常称为边界条件，为过程结束或开始时的状态。式（5.11）和式（5.12）一起被称为动态规划的基本函数方程，即动态规划的基本方程，也被称为递归方程。用动态规划方法解决实际问题，需要根据实际情况建立动态规划的数学模型，这是解决整个问题中非常重要的一步，也是很困难的一步。

建立动态规划的数学模型一般包括以下步骤：

（1）划分阶段——依据实际问题的性质，按照时间或空间的顺序，将过程划分为若干个相互联系的阶段，将求解精度和计算速度等多方面因素综合考虑，以便有效地求解。（2）确定状态变量及其取值范围——状态变量既能描述过程演变的状态，又要满足无后效性的要求，且状态变量的维数应尽量地小，一般是从限制系统运筹的条件或从问题的约束条件中去寻找，在确定状态变量后还需进一步明确变量在各阶段的取值范围，即确定允许状态集合。

（3）确定决策变量及其取值范围——决策变量是状态的函数，对于k阶段的决策变量确定后，它将影响本阶段的效应，并会影响下一阶段的初始状态，从而影响第k+1阶段到最终状态的最优指标函数。决策变量的取值范围，即确定允许决策集合。（4）建立状态转移方程——如果给定第k阶段状态变量式sk的值，则该阶段的决策变量xk一经确定，第k+1阶段的状态变量sk+1的值也就完全确定了，即状态转移方程sk+1=Tk(sk，xk)必须具有递推关系。

（5）确定阶段效应和最优指标函数，建立动态规划的函数方程——阶段效应函数rk(sk，xk)根据问题的性质，可以为收益函数或损耗函数，而第k阶段的最优指标函数fk(sk)是指从k阶段到n阶段获得的总效应，要求fk(sk)是按阶段单调的，最后建立满足式（5.11）和式（5.12）的基本函数方程。以上5个步骤全部完成后，即完成了动态规划数学模型的建立，而这并不是轻而易举的，需要读者不断地实践并总结经验，才能深刻领会，才能有效地解决此类问题。

2.动态规划的求解方法

经过长期对实际问题的研究发现，最常见的最优指标函数形式有两类,即加法型和乘法型，所以动态规划的递推形式的基本方程分别为和通过递推基本方程式（5.13）（或式（5.14））及状态转移方程（5.10）求解动态规划的过程，可以发现,是由

k=n递推至k=1，这种由后向前逐步递推的方法，称为逆序解法。逆序解法是一般常用的方法，当求出全过程的最优策略时即可得到原问题的最优解。有些问题也可采用由前向后逐步递推的方法，称为顺序解法，这时状态转移方程和基本方程（加法型的）分别为同理，与最优指标函数是乘法形式对应的基本方程，读者也可以很容易地写出。既可用逆序解法求解，又可用顺序解法求解的多阶段决策过程，称为可逆过程，如最短路线问题的求解过程就是一个可逆过程。在此主要讨论逆序解法，顺序解法类似。以下通过举例来讲述动态规划建模及求解的全过程。【例5.22】(投资分配问题)

假设某工业部门通过各种正规渠道共筹集了600万元的资金供四个老企业进行技术改造，各企业技术改造后所得的利润（万元）与投资额（百万元）大小的关系如表5.28所示。要求确定各工厂的投资资金，使得这些工厂接受后，该部门的总利润达到最大。分析：这类问题属极为典型的“资源分配”问题，即解决如何将一定数量的一种或若干种资源（如人力、资金、材料、时间等），合理分配给若干个使用者（或生产方式），使资源的投放可以达到最优。

假定有一种资源，其数量为a，现需要将它分配给n个使用者，而使总收益最大。若分配给第i个使用者的数量为xi(i=1，2，…，n)，且由此产生的收益为gi(xi)，gi(xi)自然应该是xi的非递减函数，于是该问题的数学模型为(5.17)这是一种资源的分配问题，称为一维分配问题。解这是一类静态的线性或非线性规划问题，此类问题可以看做一个多阶段决策问题，利用动态规划的方法进行求解。

建立动态规划数学模型：把资金分配给前k个工厂的过程作为第k个阶段（k=1，2，3，4），这样就将过程划分为相互联系的四个阶段。设状态变量sk为分配给第k个工厂到第n个工厂的资金总额，即k阶段初所拥有的资金额，显然可知0≤sk≤a（a=600万元，此不等式即允许状态集合）。决策变量xk为分配给第k个工厂的资金额，此处0≤xk≤sk。

状态转移方程为阶段收益函数gk(sk，xk)为第k个工厂接受xk资金后所得的利润。最优指标函数fk(sk)就是将资金sk完全

您可能关注的文档

文档评论（0）

酱酱 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

《数学建模与数据学实验》课件第5章.ppt