人工神经网络94444.pptVIP

下载本文档

3
0
约9.49千字
约 91页
2018-12-28 发布于湖北
举报
版权申诉

人工神经网络94444.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

算法的改进 1、BP网络接受样本的顺序对训练结果有较大影响。它更“偏爱”较后出现的样本 2、给集中的样本安排一个适当的顺序，是非常困难的。 3、样本顺序影响结果的原因：“分别”、“依次” 4、用(X1,Y1)，（X2,Y2），…，（Xs,Ys）的“总效果”修改W(1) ，W(2) ，…，W(L)。 ?w(k)ij=∑?p w(k)ij 消除样本顺序影响的BP算法 1 for k=1 to L do 1.1 初始化W(k)； 2 初始化精度控制参数ε； 3 E=ε+1; 4 while Eε do 4.1 E=0; 4.2 对所有的i，j，k：? w (k)ij=0； 4.3 对S中的每一个样本（Xp,Yp）： 4.3.1 计算出Xp对应的实际输出Op； 4.3.2 计算出Ep； 4.3.3 E=E+Ep； 4.3.4 对所有i，j根据相应式子计算?p w (L)ij； 4.3.5 对所有i，j：? w (L)ij=? w (L)ij+?p w (L)ij； 4.3.6 k=L-1； 4.3.7 while k≠0 do 4.3.7.1 对所有i,j根据相应式子计算?p w (k)ij； 4.3.7.2 对所有i,j：? w (k)ij=? w (k)ij+?p w (k)ij； 4.3.7.3 k=k-1 4.4 对所有i，j，k：w (k)ij= w (k)ij+ ?w (k)ij; 4.5 E=E/2.0 算法4-2 分析较好地解决了因样本的顺序引起的精度问题和训练的抖动问题收敛速度：比较慢偏移量：给每一个神经元增加一个偏移量来加快收敛速度冲量：联接权的本次修改要考虑上次修改的影响，以减少抖动问题算法4-2 分析——冲量设置 Rumelhart等人1986年 ?wij=αδjoi+β?wij′ ?wij′为上一次的修改量，β为冲量系数，一般可取到0.9 Sejnowski与Rosenberg ，1987年 ?wij=α((1-β)δjoi+β?wij′) ?wij′也是上一次的修改量，β在0和1之间取值算法的实现主要数据结构 W[H，m]——输出层的权矩阵； V[n，H]——输入（隐藏）层的权矩阵； ?o[m]——输出层各联接权的修改量组成的向量； ?h[H]——隐藏层各联接权的修改量组成的向量； O1——隐藏层的输出向量； O2——输出层的输出向量； (X，Y)——一个样本。算法的主要实现步骤用不同的小伪随机数初始化W，V；初始化精度控制参数ε；学习率α ；循环控制参数E=ε+1；循环最大次数M；循环次数控制参数N=0； while Eε NM do 4.1 N=N+1；E=0； 4.2 对每一个样本(X,Y)，执行如下操作对每一个样本(X,Y)，执行的操作 4.2.1 计算：O1=F1(XV)；O2=F2(O1W)； 4.2.2 计算输出层的权修改量 for i=1 to m 4.2.2.1 ?o[i]= O2 [i]*(1- O2 [i])*(Y[i]-O2 [i])； 4.2.3 计算输出误差：for i=1 to m 4.2.3.1 E=E+(Y[i]-O2 [i])2；对每一个样本(X，Y)，执行的操作 4.2.4 计算隐藏层的权修改量：for i=1 to H 4.2.4.1 Z=0； 4.2.4.2 for j=1 to m do Z=Z+W[i,j]* ?o[j]； 4.2.4.3 Δh[i]=Z* O1 [i](1- O1 [i]) ； 4.2.5 修改输出层权矩阵：for k=1 to H i=1 to m 4.2.5.1 W[k,i]= W[k,i]+ α*O1[k]*?o[i]； 4.2.5 修改隐藏层权矩阵：for k=1 to n i=1 to H 4.2.5.1 V[k,i]= V[k,i]+ α*X[k]* ?h[i]；建议隐藏层的神经元的个数H作为一个输入参数同时将ε、循环最大次数M等，作为算法的输入参数在调试阶段，最外层循环内，加一层控制，以探测网络是否陷入了局部极小点算法的理论基础基本假设网络含有L层联接矩阵： W(1) ，W(2) ，…，W(L) 第k层的神经元：Hk个自变量数： n*H1+H1*H2+H2*H3+…+HL*m 样本集： S={ (X1,Y1),(X2,Y2),…,(Xs,Ys)} 误差测度: 用E代表EP，用（X，Y）代表（XP，YP） X=(x1，x2，…，xn) Y=(y1，y2，…，ym) 该样本对应的实际输出为 O=（o1，