突触动力学Ⅱ有监督学习 - 西安电子科技大学电子工程学院.ppt

下载文档 降价啦

1
0
约1.46千字
约 12页
2017-06-10 发布于天津
举报
版权申诉
保障服务

突触动力学Ⅱ有监督学习 - 西安电子科技大学电子工程学院.ppt

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

chapter 5 突触动力学Ⅱ—— 有监督学习学号：0622310213 姓名：余景景本章内容要点有监督学习的理论解释有监督的函数估计有监督的学习相当于操作性条件反射有监督的学习相当于有先验知识的随机模式学习前馈网络的监督学习算法感知器最小均方误差（LMS）算法反向传播（BP）算法第一部分内容有监督学习和无监督学习有监督的函数估计有监督学习相当于操作性条件反射有监督学习相当于有先验知识的随机模式学习有监督学习给定一系列训练样本，其中每个样本都做上了标记，比如说标记出这个样本来自对一个苹果的一次观测。学习的目的是从这些带有标记的样本中学习到一些概念,比如说什么样的数据对应苹果而不是香蕉,并且在未来给出新的样本时,能够正确预测新样本的标记。无监督学习给定一系列没有任何标记的训练样本,学习的目的时发现隐藏在这些样本中的某种结构,例如样本的聚类情况。有监督的函数估计给定观察得到的随机矢量样本对：要估计一个未知函数：使得期望误差函数E[J]最小。误差=期望输出-实际输出有监督的函数估计设N为一个神经网络的传递函数，那么可以定义瞬时误差为，这是一个随机向量，由于我们不知道联合概率密度函数p(x,y)无法求出，一般用均方差替代。随机逼近用观测到的随机量来估计期望值，然后在离散的近似算法中使用这些估计量。用的比较多的近似算法是随机梯度下降法。如本章将要讲述的Widrow’s LMS算法中所用的就是随机梯度。有监督学习相当于操作性条件反射操作性条件反射强化响应，如果输入与期望的输出不同，就调节权值m。无监督学习相当于传统条件反射有监督学习相当于有先验知识的随机模式学习模式：模式空间上的点时变模式：定义在中的轨迹线随机模式学习由已知的样本x(1)，x(2)…x(n)来估计x的概率密度函数p(x) 模式类：是的子集，也叫决策类，满足：有监督学习相当于有先验知识的随机模式学习类的概率其中，是一个指示器函数，定义为指示函数指出了模式 x 的类隶属关系。如果 S 是将映射到而不是。就称模式 x 以不同的程度隶属于不同的类。类的概率满足区分学习类型的标准：先验知识在有监督和无监督模式学习中，系统都不知道它们的区别在于是否有先验知识以及学习系统如何利用贝叶斯学习中用到了指示器函数，是有监督的学习噪声随机竞争学习律：没有使用类成员信息校正突触矢量，是非监督学习监督随机竞争学习律：采用增强函数奖励正确的模式分类＋1，惩罚错误的模式分类为－1。是有监督模式学习。 * * 环境学习系统状态向量传统条件反射强化刺激。这种神经网络直接把输入 x耦合到输出y。例如，一个生物体学会了一刺激响应对：那么在条件刺激 S中加一个条件B进行学习，得到不断强化刺激，直到输入B时反应为R。这样就有：也就是学会了一条规则。如巴普洛夫条件反射试验。 *