性能曲线和最优点.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
性能曲线和最优点

神经网络设计 (美) Martin T. Hagan Howard B. Demuth Mark H. Beale 著 戴葵等译 第八章 性能曲面和最优点 性能指数:衡量网络性能的定量标准。性能指数在网络性能良好的时候,是很小的,反之则很大。在这里我们假设性能指数是已知的,以后讨论性能指数的选择方法。 优化过程的第二步是搜索减小性能指数的参数空间(调整网络权值和偏置值)。 1.泰勒级数 用函数F(x)表示要最小化的性能指数,其中x是要调整的参数。假设F(x)的各级导数均存在。那么F(x)可表示成灾某些指定点x*伤的泰勒级数展开。 通过泰勒级数展开项的数量,可以用泰勒级数近似估计性能指数,例如设 2.向量的情况 神经网络的性能参数并不是一个纯量x的函数,它是所有网络参数(各个权值和偏置值)的函数,参数的数量可能是很大的。因此要将泰勒级数展开形式扩展为多变量形式。 这个函数在x*的泰勒级数展开为 这个表达式有些复杂,可以写成矩阵形式 这里为梯度,定义为 为赫森矩阵,其定义为: 3.方向导数 梯度的第i个元素,是性能指数F在轴的一阶导数,赫森矩阵的第i个对角元素是性能指数F沿轴的二阶导数。这就要求我们能够求出函数在任意方向上的一阶、二阶导数。 设为沿所求导数方向上的 一个向量,此方向导数可由下式求出: 沿的二阶导数也可以写成 我们观察上面的两个式子会发现,分子部分是方向向量与梯度的内积,所以,最大斜率出现在方向向量和梯度同向时。 4.极小点 强极小点 如果存在某个纯量,使得当时,对所有都有成立,这个点称为的强极小点。 换句话说,从一个强极小点出发,沿任意方向移动任何一个小的距离都将使增大。 全局最小点 如果点使得对所有的都成立,则称该点为全局最小点。 对于一个强极小点,在较小的邻域之外可能会存在比更小的点,故又称局部最小点。对于一个全局最小点,在参数空间内任何其他点的值都比大。 弱极小点 一个弱极小点,无论向任何方向移动,函数值都不会减小,但可能沿某些方向的值不变。 5.优化的必要条件 定义了最优点后,必须给出这种点需要满足的条件。 此处 (1)一阶条件 要使为极小点,则要使函数在时增大或不减小。这就要求 但是,如果这一项为正,即 , 则推导出: 这是自相矛盾的。所以,只有唯一选择 所以一个极小点处的梯度一定为零,这就是局部极小点的一节必要条件。这个点称之为驻点。 (2)二阶条件 函数在驻点处的梯度为0,由泰勒级数的展开式可得: 要使上式对于任意的成立,赫森矩阵必须为正定矩阵。 正定矩阵定义为:对于任意的向量有 如果对于任意向量,有 则称为半正定矩阵。 如果所有特征值为正,则矩阵为正定矩阵,如果所有特征值不为负,则矩阵为半正定矩阵。

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档