网站大量收购独家精品文档,联系QQ:2885784924

.3 BP算法的程序实现.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.3 BP算法的程序实现

北京工商大学信息工程学院韩力群制作 * 3.4.3 BP算法的程序实现 (1)初始化; (4)计算各层误差信号; (5)调整各层权值; (6)检查是否对所有样本完成一次 轮训; (7)检查网络总误差是否达到精 度要求。 (2)输入训练样本对X? Xp、d? dp 计算各层输出; (3)计算网络输出误差; 3.4.3 BP算法的程序实现 然后根据总误差计算各层的误差信号并调整权值。 另一种方法是在所有样本输入之后,计算网络的总误差: 3.4.4 多层前馈网(感知器)的主要能力 (1)非线性映射能力 多层前馈网能学习和存贮大量输入-输出模式映射关系,而无需事先了解描述这种映射关系的数学方程。只要能提供足够多的样本模式对供BP网络进行学习训练,它便能完成由n维输入空间到m维输出空间的非线性映射。 3.4.4 多层前馈网(感知器)的主要能力 (2)泛化能力 当向网络输入训练时未曾见过的非样本数据时,网络也能完成由输入空间向输出空间的正确映射。这种能力称为多层前馈网的泛化能力。 (3)容错能力 输入样本中带有较大的误差甚至个别错误对网络的输入输出规律影响很小。 3.4.5误差曲面与BP算法的局限性 误差函数的可调整参数的个数 nw 等于各层权值数加上阈值数,即: 误差 E 是 nw+1 维空间中一个形状极为复杂的曲面,该曲面上的每个点的“高度”对应于一个误差值,每个点的坐标向量对应着 nw 个权值,因此称这样的空间为误差的权空间。 3.4.5误差曲面与BP算法的局限性 误差曲面的分布有两个特点: 特点之一:存在平坦区域 3.4.5误差曲面与BP算法的局限性 特点之二:存在多个极小点 多数极小点都是局部极小,即使是全局极小往往也不是唯一的,但其特点都是误差梯度为零。 误差曲面的平坦区域会使训练次数大大增加,从而影响了收敛速度;而误差曲面的多极小点会使训练陷入局部极小,从而使训练无法收敛于给定误差。 3.5标准BP算法的改进 标准的BP算法在应用中暴露出不少内在的缺陷: ⑴ 易形成局部极小而得不到全局最优; ⑵ 训练次数多使得学习效率低,收敛速度慢; ⑶ 隐节点的选取缺乏理论指导; ⑷ 训练时学习新样本有遗忘旧样本的趋势。 针对上述问题,国内外已提出不少有效的改进算法,下面仅介绍其中3种较常用的方法。 3.5标准BP算法的改进 1 增加动量项 α为动量系数,一般有α∈(0,1) 2 自适应调节学习率 设一初始学习率,若经过一批次权值调整后使总误差↑,则本次调整无效,且?=β?(β1 ); 若经过一批次权值调整后使总误差↓,则本次调整有效,且?=θ? (θ1 )。 3.5标准BP算法的改进 3 引入陡度因子 实现这一思路的具体作法是,在原转移函数中引入一个陡度因子λ 3.6 BP网络设计基础 一 、训练样本集的准备 1.输入输出量的选择 输出量代表系统要实现的功能目标,例如系统的性能指标,分类问题的类别归属,或非线性函数的函数值等等。 输入量必须选择那些对输出影响大且能够检测或提取的变量,此外还要求各输入变量之间互不相关或相关性很小,这是输入量选择的两条基本原则。 3.6 BP网络设计基础 一 、训练样本集的准备 1.输入输出量的选择 从输入、输出量的性质来看,可分为两类:一类是数值变量,一类是语言变量。 数值变量的值是数值确定的连续量或离散量。 语言变量是用自然语言表示的概念,其“语言值”是用自然语言表示的事物的各种属性。当选用语言变量作为网络的输入或输出变量时,需将其语言值转换为离散的数值量。 3.6 BP网络设计基础 一 、训练样本集的准备 2. 输入量的提取与表示 (1)文字符号输入 XC=(111100111)T XI=(111100111)T XT=(111100111)T 3.6 BP网络设计基础 一 、训练样本集的准备 2. 输入量的提取与表示 (2)曲线输入 p=1,2,…,P 3.6 BP网络设计基础 一 、训练样本集的准备 2. 输入量的提取与表示 (3)函数自变量输入 一般有几个输入量就设几个分量,1个输入分量对应1个输入层节点。 (4)图象输入 在这类应用中,一般先根据识别的具体目的从图象中提取一些有用的特征参数,再根据这些参数对输入的贡献进行筛选,这种特征提取属于图象处理的范畴。 (1)“n中取1”表示法 “n中取1”是令输出向量的分量数等于类别数,输入样本被判为哪一类,对应的输出分量取1,其余 n-1

文档评论(0)

qianqiana + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5132241303000003

1亿VIP精品文档

相关文档