第06讲反向传播网络-Read.ppt

下载文档 降价啦

2
0
约6千字
约 37页
2017-05-23 发布于天津
举报
版权申诉
保障服务

第06讲反向传播网络-Read.ppt

1、本文档共37页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第06讲反向传播网络-Read

第06讲反向传播网络 zoujiang@public.wh.hb.cn 邹江反向传播网络(Back—Propagation Network，简称BP网络)是将W—H学习规则一般化，对非线性可微分函数进行权值训练的多层网络。 BP网络是一种多层前向反馈神经网络，其神经元的变换函数是S型函数，因此输出量为0到1之间的连续量，它可以实现从输入到输出的任意的非线性映射。由于其权值的调整采用反向传播（Backpropagation）的学习算法，因此被称为BP网络。 BP网络主要用于： 1)函数逼近：用输入矢量和相应的输出矢量训练一个网络逼近—个函数； 2)模式识别：用一个特定的输出矢量将它与输入矢量联系起来； 3)分类：把输入矢量以所定义的合适方式进行分类； 4)数据压缩：减少输出矢量维数以便于传输或存储。 6．1 BP网络模型与结构感知器和自适应线性元件的主要差别在激活函数上：前者是二值型的，后者是线性的。 BP网络具有一层或多层隐含层，除了在多层网络上与前面已介绍过的模型有不同外，其主要差别也表现在激活函数上。 BP网络的激活函数必须是处处可微的，所以它就不能采用二值型的阀值函数{0，1}或符号函数{—1，1}，BP网络经常使用的是S型的对数或正切激活函数和线性函数。只有当希望对网络的输出进行限制，如限制在0和1之间，那么在输出层应当包含S型激活函数，在一般情况下，均是在隐含层采用S型激活函数，而输出层采用线性激活函数。 BP网络的特点： 1、输入和输出是并行的模拟量； 2、网络的输入输出关系是各层连接的权因子决定，没有固定的算法； 3、权因子是通过学习信号调节的，这样学习越多，网络越聪明； 4、隐含层越多，网络输出精度越高，且个别权因子的损坏不会对网络输出产生大的影响 6．2 BP学习规则 BP算法属于δ算法，是一种监督式的学习算法。其主要思想为：对于q个输入学习样本：P1，P2，……Pq，已知与其对应的输出样本为：T1，T2，……Tq。学习的目的是用网络的实际输出A1，A2，……Aq，与目标矢量T1，T2，……Tq，之间的误差来修改其权值，使Al，(l＝l，2…，q)与期望的Tl尽可能地接近；即：使网络输出层的误差平方和达到最小。 BP算法是由两部分组成：信息的正向传递与误差的反向传播。在正向传播过程中，输入信息从输入经隐含层逐层计算传向输出层，每一层神经元的状态只影响下一层神经元的状态。如果在输出层没有得到期望的输出，则计算输出层的误差变化值，然后转向反向传播，通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标。 6．2．1信息的正向传递 1)隐含层中第i个神经元的输出为：通过MATLAB的实现过程： 1)对于(6．1)式所表示的隐含层输出，若采用对数S型激活函数，则用函数logsig.m；若采用双曲正切S型激活函数，则用函数tansig.m； 2)对于(6．2)式所表示的输出层输出，若采用线性激活函数有purelin.m与之对应； 3)对于(6．3)式所表示的误差函数，可用函数sumsqr.m求之； 4)有learnbp.m函数专门求(6．4)、(6．7)、(6．8)和(6．10)式所表示的输出层以及隐含层中权值与偏差的变化量； 5)由(6.5)和(6.9)式所表示的误差的变化有函数deltalin.m、deltatan.m、deltalog.m来解决。它们分别用于线性层、双曲正切层和对数层。 6.3 BP网络的训练过程为了训练一个BP网络，需要计算网络加权输入矢量以及网络输出和误差矢量，然后求得误差平方和。当所训练矢量的误差平方和小于误差目标，训练则停止，否则在输出层计算误差变化，且采用反向传播学习规则来调整权值，并重复此过程。当网络完成训练后，对网络输入一个不是训练集合中的矢量，网络将以泛化方式给出输出结果。为了能够较好地掌握BP网络的训练过程，我们用两层网络为例来叙述BP网络的训练步骤。 1)用小的随机数对每一层的权值W和偏差B初始化，以保证网络不被大的加权输入饱和；并进行以下参数的设定或初始化： a)期望误差最小值error_goal； b)最大循环次数max_epoch； c)修正权值的学习速率1r，一般情况下k＝0．0l~0．7； d)从1开始的循环训练：for epoch＝1：max_epoch； 2)计算网络各层输出矢量A1和A2以及网络误差E： A1＝tansig(W1*P，B1)； A2＝purelin(W2*A1，B2)； E＝T-A； 3)计算各层反传的误差变化D2和D1并计算各层权值的修正值以及新权值： D2＝deltalin(