软计算-4.ppt

下载文档 降价啦

1
0
约6.08千字
约 42页
2015-07-24 发布于河南
举报
版权申诉
保障服务

软计算-4.ppt

1、本文档共42页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

二、Boltzmann Machin— 随机型神经网络 1、背景 H网的优缺点：可解组合优化问题这样的难题，但并不是总可以得到解 BM网的想法：改善H网神经元的动作，使正解率大为提高 1985年，HINTON等人把模拟退火算法引入NN中，提出了BM网络模拟退火算法：模拟金属构件退火过程的一种算法模拟退火算法先用高温将金属熔化，使其中的粒子可自由运动然后逐渐降低T，使粒子自由运动趋势减弱，形成低能态晶格若在凝结点附近温度下降的速度足够慢，则金属或固体物质一定会形成最稳定的结构状态在降温过程中，各个粒子都可能经历了由高能态向低能态，有时又暂时由低能态向高能态，最终趋向低能态的变化过程用NN解组合优化问题，需要： 1）构造符合问题的能量函数E 将解代入，E取小的值，非解，则E取较大的值 2）将问题的能量函数与NN网的一般能量函数对应，求出权重与阈值求解——对能量函数最小值的探索 H网的能量图，有多个峰、谷作为联想记忆模型使用，多个谷与记忆内容对应，好但对于找最小值不利，易掉入途中的谷中由金属等的退火过程受到的启发：神经网络的状态——金属内部的粒子网络在各个状态下的能量函数Ei——粒子所处的能态设置控制参数T T较大时，E由低向高变化的可能性也较大随着T的减小，这种可能性也减小若把该参数看作温度，则整个网络状态变化过程就完全模拟了金属的退火过程当T下降到一定程度时，网络将收敛于能量的最小值 BM网改进神经元的输出不仅仅受输入之和与0的大小关系的影响而是以概率方式进行动作，这样，有时，E也可能向增加的方向进行结果，即使落入途中的谷中，也有可能跳出，到达最小值的可能性就增大了找到最小解的图 BM网在概率的动作上下了很大的工夫：最初，能量向增大方向的运动得到较大的允许，E可在较大的范围内运动，寻找最小值可能的位置逐渐，这样的随机动作被限制，E向减小的方向运动的动作占了多数，最后，容易到达最低部分 2、BM网结构及原理 BM网的结构：基本上与离散型H网相似由N个神经元组成，每个神经元取0(-1）、1二值输出神经元之间以对称连接权相互连接与H网不同处图 BM把整个神经元分为可视层与隐含层二部分，可视层又分为输入部分和输出部分，但无明显的层次界限，非单向连接 BM网算法根据其两大用途分为： 1）工作规则网络的状态更新规则主要用于解组合优化问题 2）学习规则网络连接权和输出阈值的修正规则主要用于以网络作为一种外界概率分布的模拟机，也是BM网的一个独特的用途 BM网的工作规则与H网十分相似。不同之处：以概率方式取代阶跃函数方式，来决定网络根据其神经元的内部状态而进行的状态更新有温度T，随着网络状态更新的进行而逐渐由大减小设网络有N个神经元，各神经元之间连接权为{wij}，各神经元的输出阈值为{θi}，输出为{ui}，神经元的内部状态为{Hi} i，j=1，2，…N 取T(t=0)=T0，给{wij}, {θi} 赋 [-1，1] 内的随机值，并使wij=wji；（实际应用中，需要基于优化问题解出） 1）从N个神经元中随机选取一个神经元i 2）求神经元 i的内部状态 Hi=∑wijuj(t)-θi，j=1…n, j≠i 3）按下式所示概率将神经元 i的状态更新为1 p[ui(t+1)=1]=1/(1+exp(-Hi(t)/T)) p[ui(t+1)=0]=1 - p[ui(t+1)=1] 不同的Hi对应不同的概率 4）i以外的神经元输出保持不变 uj(t+1) = uj(t), j=1,2,…,N, j≠i 5）令 t=t+1，按下式计算新的温度参数T(t+1) T(t+1)=T0/log(t+1)——降温方案 6）返回到1），直到T Td（预先给定） T0，Td凭经验给出现已证明，按上面降温方案，能保证网络收敛于全局最小值缺点：收敛时间太长快速降温方案：T(t) = T0 /（1+t） Boltzmann分布当更新次数足够大后，网络某状态的出现概率将服从下式分布： Q(Ei) = (1/Z) exp (-Ei/T) Z=∑exp (-Ei/T) ,i=1…N ——常数，网络所有状态的能量之和为常数 Ei—状态{ui}所对应的网络能量这就是Boltzmann分布：状态的能量越小，这一状态出现的概率就越大，即最小的能量以最大的概率出现 BM网的能量变化 H网的E变化： ΔEi=-[ui(t+1)-ui(t)]Hi(t) 当神经元i按概率p[ui(t+1)=1]在t+1时取1时： ΔEi=-[1-ui(t)]Hi(t)，该式当Hi≥0时，ΔEi≤0 当Hi≤0时，ΔEi≥0 这在H网中是不允许的，而在BM