17 第6章神经网络 part3.ppt

下载文档 降价啦

6
0
约7.8千字
约 61页
2016-12-30 发布于贵州
举报
版权申诉
保障服务

17 第6章神经网络 part3.ppt

1、本文档共61页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

神经网络刘芳，戚玉涛 qi_yutao@163.com BP网络和BP算法线性不可分问题：感知器模型的局限三层感知器多层网络的表达能力 BP网络：多层感知器 BP算法：反向传播算法的思想和流程，训练协议，隐含层的作用，实用技术反向传播算法（BP算法）敏感度的反向传播反向传播算法（BP算法） BP算法流程： Step1：选定权系数初值 Step2：重复下述过程直至收敛 (对各个样本依次计算) Step2.1 前馈: 从前向后各层计算各单元反向传播算法（BP算法） Step2.2 :对输出层计算 Step2.3 :从后向前计算各隐层 Step2.4 :计算并保存各个权值修正量反向传播算法（BP算法） Step2.5:修正权值 BP算法的训练协议训练协议(学习协议)：神经网络训练过程中如何根据训练样本调整权值三种最有用的训练协议：随机训练( stochastic training ) :模式随机从训练集中选取，每输入一个模式，权值就更新一次成批训练( batch training ) :所有模式一次全部送入网络，然后才进行一次权值更新在线训练( online training ) : 每种模式只提供一次，每提供一种模式，权值更新一次 BP算法的训练协议随机反向传播 BP算法的训练协议成批反向传播 BP算法的训练协议在线反向传播隐含层的作用隐含层的作用：学习到一组非线性映射，将样本映射到线性可分的空间非线性弯曲能力，本质上是一种非线性的特征映射异或问题的例子：隐含层的作用隐含层的非线性弯曲能力 BP算法的优缺点优点：理论基础牢固推导过程严谨物理概念清晰通用性好所以，它是目前用来训练多层前向网络（BP网络）较好的算法。 BP算法的优缺点缺点： BP算法只能收敛于局部最优解，不能保证收敛于全局最优解；当隐层元的数量足够多时，网络对训练样本的识别率很高，但对测试样本的识别率有可能很差，即网络的推广能力有可能较差。 BP算法的实用技术输出函数（激活函数）输入信号尺度变换 c类问题的目标输出带噪声的训练法人工“制造”数据 BP算法的实用技术输出函数（激活函数）应具备的性质非线性：非线性特征映射，否则三层网络将等同于两层网络的计算能力饱和性：存在最大和最小值，即输出有上下界连续性：在整个自变量范围内都有定义光滑性：在整个自变量范围内一阶导数存在最好有单调性：导数在自变量范围内不变号，避免引入不必要的局部极值 Sigmoid函数满足上述性质，因此被广泛采用 BP算法的实用技术输入信号尺度变换鱼分类的例子：x1 :质量 x2:长度 x1 = 1500克， x2=0.3米，则网络权值的调整主要由x1 控制 x1 = 1.5千克， x2=300毫米，则网络权值的调整主要由x2控制解决方案：输入特征尺度变换，使得每个特征在整个训练集上的均值为零每个特征的方差相同，如都为1.0 BP算法的实用技术 c类问题的目标输出 Sigmoid函数的饱和值±1.716永远不可能达到，存在误差 c类问题的判决准则：如果样本x属于第i类，则第i个输出单元的目标输出为 +1，其他输出单元为-1 例如：四类情况，x属于第3类，目标输出则为（ -1，-1, +1，-1 ） BP算法的实用技术带噪声的训练法当训练集很小时，可以构造一个虚拟的或替代的训练模式来使用（建立概率模型），就好像它们是从源分布中抽样出来的正常的训练模式在没有具体特定信息时，一个自然的假设就是此代替模式应该加入一个d维噪声，以获得真实的训练点这种有噪声的训练方法实际上可用于任一分类方法，尽管对于高度局部化的分类器（如最近邻分类器）它通常并不改善准确率 BP算法的实用技术人工“制造”数据在训练模式不足的情况下，有时可以人工制造一些训练样本需要利用问题的先验知识，如某种“几何不变性”，制造出一些能传达更多信息的训练样本数据变换：例如字符识别问题中旋转缩放字符笔画宽窄变化 BP算法的实用技术隐单元数：隐单元个数决定了网络的表达能力，从而决定了判决边界的复杂度简单问题需要较少的隐单元复杂问题需要较多隐单元过少隐单元造成神经网络表示能力下降过多隐单元造成对训练集的“过拟合” 经验规则选取隐单元个数，使得网络中总的权值数大致为样本数的1/10 BP算法的实用技术权值初始化 BP算法的实用技术学习率：不同学习率的收敛效果 Sigmoid网络的学习率：初始化学习率约为0.1；如果发散，则调小学习率；如果学习速度过慢，则调大学习率。 BP算法的实用技术冲量项（momentum）问题：

您可能关注的文档

文档评论（0）

fpiaovxingl + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

17 第6章神经网络 part3.ppt