- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
无约束数值优化基础1
无约束数值优化基础
最优化问题
最优化问题的数学定义
目标函数是光滑的
变量可以是向量
目标函数的光滑特性
为了简单起见,我们考虑光滑函数,因为
光滑函数是各阶可微的
首先函数是连续的
且函数可微
且各阶导数连续且可微
由于函数连续可微,提供了(不为垂直的)切线方向
几个相关概念
不连续函数
连续函数但不可微
连续可微函数但不光滑
向量变量
一般情况下变量是用特征向量的形式表示
向量如何求导
Partial derivative
Vector value
数值最优化
没有闭式解
函数信息昂贵
变量个数小,但函数计算复杂
变量个数巨大
思路
从某点出发
根据局部信息,作一些迭代
判断是否达到了解
解
为什么我们要定义一个函数的解?
全局极值
在整个变量域,难找,也不必要
局部极值
某个开区间,容易找,通常情况下称为解
特殊的局部极值
严格局部极小值
孤立局部极小值
课堂测试(1)
以下哪些说法是对的
严格局部极小值都是孤立局部极小值
严格局部极小值不都是孤立局部极小值
孤立局部极小值都是严格局部极小值
孤立局部极小值不都是严格局部极小值
如何判断一个局部极值
在f(x)是二阶连续可微的情况下,x*是局部极值
必要条件
充分条件
算法(1)
数值最优化算法的基本思想
从给定的x0出发
产生一系列的x1,x2,x3…xK
当收敛条件达到时
结束算法
单调性要求:f(x1)f(x2)f(x3)…
两种策略
Line search线搜索
选择一个方向,再选择步长
Trust region信赖域
定一个范围,根据这个区域内的近似模型选择方向
算法(2)
Choose a,x0,
While(not convergent) do
choose ak,pk
xk+1=xk+akpk
k=k+1
end
tmp0=xk,0+akpk,0
tmp1=xk,1+akpk,1
tmp2=xk,2+akpk,2
…
tmpi=xk,i+akpk,i
tmpN=xk,N+akpk,N
xk,0=tmp0
….
xk,N=tmpN
Line search:先确定pk,再确定ak
Trust region: 先确定ak最大范围r,在确定pk
最后确定真正使用的ak
两种策略
线搜索方法
选择一个函数值下降的方向
最速下降
Newton法
Quasi-Newton法
步长
足够小
使下一次函数值有效减小
足够大
能较快收敛
Linesearch:方向的选择(1)
明显的一个选择:梯度
最速下降
Downhill direction
优点:计算简便
缺点:对于复杂问题收敛速度慢
对归一化敏感
Newton方法
Cholesky分解:B=LDLT
For j=1,2,…,n,do
cjj=ajj-Σs=1,to j-1dsl2js
dj=cjj
For i=j+1,…n,do
cij=aij-Σs=1 to j-1dslisljs
lij=cij/dj
end
end
目标:迭代至极值
初始点x0
For k=0,1,2,… do
找到正定矩阵Bk
解Bkpk=-Δf(xk)
xk+1=xk+akpk
End
目标:使D元素均为正,且L,D中元素不太大
dj==max(|cjj|,(maxji=n |cij|/b)2,e )
Quasi-Newton法
思想:找一个Hessian矩阵的近似
并根据每一轮的新信息进行有效更新
BFGS:近似矩阵是对称的,且Bk与Bk+1的差为秩=2的矩阵
课堂测试(2)
如果函数形式为
则在最速下降中,最好的步长ak为?
思考:最速下降、牛顿法,Quasi-Newton法的优缺点是什么?
Linesearch:步长的选择(1)
希望的目标
实际上
目标函数有效减少
寻找合适步长的计算代价不太高
Linesearch:步长的选择(2)
Linesearch:步长的选择
Wolfe Condition
Sufficient decrease: Armijo condition
Not too small: curvature condition
Backtracking算法
初始化a0,p1,c
重复
直到满足Armijo condition
否则:a=pa
课堂测试(3)
下面哪些说法是对的,为什么?
最速下降法的步长初始为1
Newton法的步长初始为1
Quasi-newton法的步长初始为1
如果0c2c11,则有可能找不到满足wolfe条件的步长
信赖域方法
选择一个信赖域
在
在信赖域内选择一个与目标函数具有相同特性的近似函数
同时选择一个方向和步
您可能关注的文档
最近下载
- SICK西克KTS Core色标传感器操作手册.pdf VIP
- GB50345-2012 屋面工程技术规范.docx VIP
- 船舶油漆使用基本基础知识.pdf VIP
- 四年级(上)语文课文同步仿写、续写1.pdf VIP
- 9 天上有颗“南仁东星”课件(共30张PPT)2025-2026学年统编版语文八年级上册.pptx VIP
- 高级保育员课件.pptx VIP
- 第十章生态系统.ppt VIP
- 《脑卒中运动障碍康复护理规范》.pdf VIP
- 2012年全国创新杯说课大赛作品汇总铰链四杆机构的类型及判定说课(新蓝).ppt VIP
- 年处理80吨茯苓提取车间提取工段工艺设计-毕业论文(设计).doc VIP
文档评论(0)