最优化方法第三章(1)..ppt

下载文档 降价啦

4
0
约5.6千字
约 38页
2019-03-07 发布于湖北
举报
版权申诉
保障服务

最优化方法第三章(1)..ppt

1、本文档共38页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

3.3 Newton法如果目标函数在上具有连续的二阶偏导数，其Hesse矩阵正定且可以表达成显式（今后记），那么使用Newton法求解（3.1）会很快地得到极小点。 1. 基本思想考虑从到的迭代过程。在点处，对按Taylor级数展开到第三项，即（3.29）因为正定，所以是正定二次函数。令得（3.30）由此解出的极小点，记为，即（3.31）是极小点的新的近似点。（3.31）称为Newton 迭代公式，由该公式产生的算法称为Newton法。注意到，当目标函数是正定二次函数（3.36）时，。这说明：对于正定二次函数，Newton法一次迭代就会得到最优解。（3.31）有直观的几何解释。函数过点的等值面方程为（3.32）在点处，用一个与曲面（3.32）最密切的二次曲面来代替它，这个二次曲面的方程即是当正定时，它是一个超椭球面，的极小点正是这个超椭球面的中心。我们就用作为极小点的新的近似点。下图画出了二维情况时的几何解释。例3.2 P154 2. 算法算法3.5（Newton法） P155 从本章起，以后两章将讨论非线性规划问题。本章首先讨论无约束最优化问题，其一般形式为（3.1）其中求解无约束问题的最优化方法可以分为两大类：一类是根据目标函数的梯度（即一阶导数），有时还要根据Hesse矩阵（即二阶导数）提供的信息构造出来的方法——导数方法。本章介绍其中的最速下降法、Newton法、共轭梯度法和拟Newton法。另一类是不使用导数，仅仅利用目标函数值的信息构造出来的方法——直接方法。本章将介绍其中的步长加速法、方法加速法和单纯形替换法。两类方法各有利弊。前者收敛速度快，但需要计算梯度，甚至需要计算Hesse矩阵；后者不涉及导数，适应性强，但收敛速度慢。一般的经验是，在可以求得目标函数导数的情况下，尽可能使用导数方法。 3.1 直线搜索直线搜索（一维搜索）是指求解如下一元函数极小化问题（3.3）的迭代方法，其中。在微积分中，解决问题（3.3）的范围一般限于方程（3.4）可以直接解出的情况。而这里介绍的直线搜索对严格的要求。当然，对于可以求出导数的情况，相应的求解方法一般也会简单些。不作直线搜索，理论上，分为精确的和不精确的。精确的直线搜索方法主要分为两类：一类为区间收缩法，另一类为函数逼近法。本节将相应地介绍两种常用的精确的直线搜索方法：适用于一般函数的黄金分割法和适用于一般连续函数的抛物线插值法。最后还将介绍实用的不精确一维搜索技术。精确的直线搜索算法的实现通常是在所谓的搜索区间上进行的 1. 搜索区间的确定在以下讨论中，总假定一元函数是单谷函数。定义3.1 设，是在L上的全局极小点。如果对于L上任意的两点，当时，；当时，，那么称是区间L上的单谷函数。下图给出了单谷函数的基本图形。定义3.2 设 , 是在L上的全局极小点。如果能够找到，使得那么闭区间就称为极小点的一个搜索区间，记为。搜索区间有时也记作，其中显然，单谷函数的定义域区间是搜索区间。单谷函数的性质。定理3.1 设是单谷函数极小点的一个搜索区间。在内任取两点，若，则是极小点的一个搜索区间；若，则是极小点的一个搜索区间。直线搜索算法的第一步一般得先确定的一个（初始）搜索区间。根据定理3.1，可以给出确定搜索区间的如下算法。算法3.1（确定搜索区间）已知：目标函数。选定初始点和步长。 ②计算，，。 ③若，则置，，，，，。，转⑤；否则转④。 ④置 ⑤计算，。若，则转⑥；否则转④。 ⑥置，（即为搜索区间），计算结束。上述过程开始时，必须选定初试点和步长。对于任意给定的，一般来说，无固定选取模式。但对于在下降算法模式中所引入的而言，可选取等于0（理论上）或接近0（实际计算中）。而对于，如果选得过小，那么需要迭代许多次才能找到一个搜索区间；如果选得太大，虽然很少几步就可能把极小点包括进来，但是这又会给下一步搜索极小点的过程增加负担。下面是确定的一种比较合理而有效的方法。第一次迭代（，即从到的迭代）时，的初始步长可取为1，或根据问题中出现的数据的数量级估计选定。而以后各次迭代的初始步长可按公式（3.5）计算，（3.5）其中。这是因为从到的距离