受限玻尔兹曼机RBM资料.ppt

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
受限玻尔兹曼机 陈文根 2016-6-12 河南工业大学 目录 一.玻尔兹曼机(BM) Ising模型 能量函数 二.受限玻尔兹曼机(RBM) 结构 玻尔兹曼机(BM) Ising模型 Ising模型是统计物理中迄今为止唯一的一个同时具备:表述简单、内涵丰富、应用广泛这三种优点的模型。 Ising模型最早的提出者是Wilhelm Lenz (1920)。后来,他让他的学生Ernst Ising对一维的Ising模型进行求解,但是并没有发现相变现象,因此也没有得到更多物理学家的关注。随后,著名的统计物理学家Lars Onsager于1944年对二维的Ising模型进行了解析求解,并同时发现了二维Ising模型中的相变现象,从而引起了更多学者的注意. 玻尔兹曼机 模型表述 考虑一个如左图所示的晶格世界。 假设第个i节点是一个小磁针,每个小磁针有上下两种状态,我们用si来表示这个状态,并且si={1,-1}。 表示磁针朝上或者朝下。网格上相邻的两个小磁针可以发生相互作用。 玻尔兹曼机 能量函数 我们可以通过总能量的概念来刻画这种相互作用:即如果两个相邻方格的小磁针状态一致(例如都是朝上),则系统的总能量减1单位,否则如果不同就加1单位。外界还可能存在磁场,如果小磁针方向与外场方向一致,则能量也会降低。我们定义总能量: 其中J为一个能量耦合常数,E{si}表示系统处于状态组合{si}下的总能量。求和下标表示对所有相邻的两个小磁针进行求和。我们看到,如果si=sj,则总能量就会减少J。H表示外界磁场的强度,它是一个参数,如果外界磁场向上H为正,否则为负。如果某个小磁针的方向与外场一致,则总能量减少一个单位。 玻尔兹曼机 玻尔兹曼机简介 BM的原理起源于统计物理学,是一种基于能量函数的建模方法,能够描述变量之间的高阶相互作用,BM的学习算法较复杂,但所建模型和学习算法有比较完备的物理解释和严格的数理统计理论作基础。BM是一种对称耦合的随机反馈型二值单元神经网络,由可见层和多个隐层组成,网络节点分为可见单元(visible unit)和隐单元(hidden unit),用可见单元和隐单元来表达随机网络与随机环境的学习模型,通过权值表达单元之间的相关性。 玻尔兹曼机 玻尔兹曼机简介(续) BM是由Hinton和Sejnowski提出的一种随机递归神经网络,可以看做是一种随机生成的Hopfield网络,是能够通过学习数据的固有内在表示解决困难学习问题的最早的人工神经网络之一,因样本分布遵循玻尔兹曼分布而命名为BM。BM由二值神经元构成,每个神经元只取1或0这两种状态,状态1代表该神经元处于接通状态,状态0代表该神经元处于断开状态。 玻尔兹曼机 结构 能量函数定义为: 根据规则,如果与神经元i相邻的所有神经元都激活,并且它们的连接权重为正的话,那么该神经元就有可能被激活。这就相当于最小化一个全局的能量函数。 受限玻尔兹曼机(RBM) 简介 Smolensky提出的RBM由一个可见神经元层和一个隐神经元层组成,由于隐层神经元之间没有相互连接并且隐层神经元独立于给定的训练样本,这使直接计算依赖数据的期望值变得容易,可见层神经元之间也没有相互连接,通过从训练样本得到的隐层神经元状态上执行马尔可夫链抽样过程,来估计独立于数据的期望值,并行交替更新所有可见层神经元和隐层神经元的值。 受限玻尔兹曼机 结构 RBM网络结构有m个可视节点和n个隐藏节点 受限玻尔兹曼机 结构(续) RBM网络有几个参数,一个是可视层与隐藏层之间的权重矩阵Wn×m,一个是可视节点的偏移量b=(b1,b2?bn),一个是隐藏节点的偏移量c=(c1,c2?cm),这几个参数决定了RBM网络将一个n维的样本编码成一个什么样的m维的样本。 首先为了描述容易,先假设每个节点取值都在集合{0,1}中,即?i,j,vi∈ {0,1},?j∈ {0,1} 。 一个训练样本x过来了取值为x=(x1,x2?xn),根据RBM网络,可以得到这个样本的m维的编码后的样本y=(y1,y2?ym),这m维的编码也可以认为是抽取了m个特征的样本。 受限玻尔兹曼机 结构(续) 隐藏节点的第j个特征的取值为1的概率为 其中的v取值就是x,hj的取值就是yj。且, 受限玻尔兹曼机 结构(续) 生成yj的过程就是: 1.先利用公式 根据x的值计算概率p(hj=1|v),其中vi的取值就是xi的值。 2.然后产生一个0到1之间的随机数,

文档评论(0)

118118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档