无约束数值优化基础1.docxVIP

下载本文档

3
0
约2.29千字
约 10页
2018-07-20 发布于江苏
举报
版权申诉

无约束数值优化基础1.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

无约束数值优化基础1

无约束数值优化基础最优化问题最优化问题的数学定义目标函数是光滑的变量可以是向量目标函数的光滑特性为了简单起见，我们考虑光滑函数，因为光滑函数是各阶可微的首先函数是连续的且函数可微且各阶导数连续且可微由于函数连续可微，提供了（不为垂直的）切线方向几个相关概念不连续函数连续函数但不可微连续可微函数但不光滑向量变量一般情况下变量是用特征向量的形式表示向量如何求导 Partial derivative Vector value 数值最优化没有闭式解函数信息昂贵变量个数小，但函数计算复杂变量个数巨大思路从某点出发根据局部信息，作一些迭代判断是否达到了解解为什么我们要定义一个函数的解？全局极值在整个变量域，难找，也不必要局部极值某个开区间，容易找，通常情况下称为解特殊的局部极值严格局部极小值孤立局部极小值课堂测试（1）以下哪些说法是对的严格局部极小值都是孤立局部极小值严格局部极小值不都是孤立局部极小值孤立局部极小值都是严格局部极小值孤立局部极小值不都是严格局部极小值如何判断一个局部极值在f(x)是二阶连续可微的情况下，x*是局部极值必要条件充分条件算法(1) 数值最优化算法的基本思想从给定的x0出发产生一系列的x1,x2,x3…xK 当收敛条件达到时结束算法单调性要求：f(x1)f(x2)f(x3)… 两种策略 Line search线搜索选择一个方向，再选择步长 Trust region信赖域定一个范围，根据这个区域内的近似模型选择方向算法（2） Choose a,x0, While(not convergent) do choose ak,pk xk+1=xk+akpk k=k+1 end tmp0=xk,0+akpk,0 tmp1=xk,1+akpk,1 tmp2=xk,2+akpk,2 … tmpi=xk,i+akpk,i tmpN=xk,N+akpk,N xk,0=tmp0 …. xk,N=tmpN Line search:先确定pk,再确定ak Trust region: 先确定ak最大范围r，在确定pk 最后确定真正使用的ak 两种策略线搜索方法选择一个函数值下降的方向最速下降 Newton法 Quasi-Newton法步长足够小使下一次函数值有效减小足够大能较快收敛 Linesearch:方向的选择(1) 明显的一个选择：梯度最速下降 Downhill direction 优点：计算简便缺点：对于复杂问题收敛速度慢对归一化敏感 Newton方法 Cholesky分解:B=LDLT For j=1,2,…,n,do cjj=ajj-Σs=1,to j-1dsl2js dj=cjj For i=j+1,…n,do cij=aij-Σs=1 to j-1dslisljs lij=cij/dj end end 目标：迭代至极值初始点x0 For k=0,1,2,… do 找到正定矩阵Bk 解Bkpk=-Δf(xk) xk+1=xk+akpk End 目标:使D元素均为正，且L,D中元素不太大 dj==max(|cjj|,(maxji=n |cij|/b)2,e ) Quasi-Newton法思想：找一个Hessian矩阵的近似并根据每一轮的新信息进行有效更新 BFGS：近似矩阵是对称的，且Bk与Bk+1的差为秩=2的矩阵课堂测试（2）如果函数形式为则在最速下降中，最好的步长ak为? 思考：最速下降、牛顿法，Quasi-Newton法的优缺点是什么？ Linesearch：步长的选择（1）希望的目标实际上目标函数有效减少寻找合适步长的计算代价不太高 Linesearch：步长的选择（2） Linesearch：步长的选择 Wolfe Condition Sufficient decrease: Armijo condition Not too small: curvature condition Backtracking算法初始化a0,p1,c 重复直到满足Armijo condition 否则：a=pa 课堂测试（3）下面哪些说法是对的，为什么？最速下降法的步长初始为1 Newton法的步长初始为1 Quasi-newton法的步长初始为1 如果0c2c11,则有可能找不到满足wolfe条件的步长信赖域方法选择一个信赖域在在信赖域内选择一个与目标函数具有相同特性的近似函数同时选择一个方向和步