- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于限制性玻尔兹曼机的叶片识别算法研究.doc
基于限制性玻尔兹曼机的叶片识别算法研究
摘 要
中国 1/vie
叶片识别是最简单和直接的植物识别方法,采用机器学习算法是解决叶片识别的重要途径。为更有效的识别叶片,提出基于限制性玻尔兹曼机的叶片识别算法,并通过实验论证算法的可行性。
【关键词】机器学习 叶片识别 限制性玻尔兹曼机
在植物的分类或者检索研究中,通常都选取植物的局部形态特征,如植物中长出现的花、叶、枝条等植物器官。虽然这些植物特征都有各自的分类价值,但与植物其它器官相比,叶片显然具有易于提取,容易转化为计算处理图像等优势,所以常在植物识别中作为主要的参照器官,同时叶片的生长形状和颜色特征又是研究植物异化的一个重要的指标,因此在传统的植物叶片识别系统中,通常都将叶片识别作为最简单和直接的植物识别方法。
近年来,越来越多的机器学习方法在现实中被广泛的应用,机器?)作为Hopfield网络的一种概率形式,具有良好的概率建模和计算能力。该模型最早脱胎于物理学中的能量模型,用于描述各种高阶变量间的相互作用机制,这种模型的计算方法相对复杂,但其理论框架相对来说较为完善,在BM中每个神经元以一定的概率处于0和1两种状态之下,BM的网络拓扑如图1所示。
其中单个圆表示隐藏节点,双圆代表可见节点,可见节点用于接收观察向量,作为一种概率性的Hopefield网络,BM的能量函数定义如下:
(1)
其中,中每个节点都以一定的概率输出为零,同时也以一定的概率输出为一,概率的输出计算如下:
(2)
(3)
当上述概率大于阈值θi时,当前节点取值为1,否则取值为零。作为一种典型的反馈形神经网络,该算法的学习过程相对比较困难,传统而言,该模型采用采样的方法估计模型的权重参数,总所周知,采样方法的缺陷在于难以估计采样收敛时间,且采样过程相对缓慢,因此这种模型虽然建模能力强大,但是其若将其应用于DBN模型中,则模型的估计时间显然过长。
2 限制性玻尔兹曼机
如上所述,玻尔兹曼机由于其内部复杂的工作方式,权值的估算通常依赖采样等方式进行,这种方法耗时耗力,为进一步简化BM的拓扑结构使得网络的计算快速有效,限制性玻尔兹曼机将BM的隐藏层节点间的相互连接取消,同时取消可见层间的相互连接,限制性玻尔兹曼机的拓扑结构如图2所示。
相较于BM的结构,RBM结构简单,因此训练和学习的效率也更加有效。在标准的RBM网络中,可见层用v表示,隐藏层用h表示,且其取值一般取0和1,对于给定了权值的RBM网络,隐藏层计算算法如下:
算法1:
(1)使用公式1和2计算每个隐藏层节点的输出概率。
(2)随机从均分布U(0,1)中抽取元素u,若该元素大于隐藏概率的输出概率则隐藏层取0,否则隐藏层取1。
当RBM中节点的取值是0和1的二值时,RBM的能量函数定义如下:
(4)
其中网络还是在BM网络,都是一种特殊的概率图网络,概率图中将可见节点的边缘概率最大化即是求解网络参数的最简单方式,可以证明最大化可视节点的边缘概率等价于最小化网络的能量函数。
下面考虑节点的输入不是二值函数时,网络的能量函数定义,一般而言,为应对这种情况,通常在独立网络单元中加入高斯噪声,因此可以定义能量函数如下:
3 RBM参数学习
从上述的讨论中可知,模型的训练可以通过最小化能量函数实现,现假设训练样本共有T个,与前述神经网络中相类似,求能量函数的导数,然后使用梯度下降方法得到网络的最终权重。由文献可得,与能量函数等同的似然函数的导数为:
上式中第一项表示求数据的期望,第二项表示求模型的期望,数据的期望相对来说求解较为容易,模型的求解设计到v,h的所有情况,计算量较大,为处理这类方法,在现代概率估计方法中通常使用GIBBS等采样算法,这种方法基于马尔科夫采样原理,当状态沿着马尔科夫链进行转移的时候,最后系统中的每个状态出现的概率将处于一个稳定的收敛状态,若此时再沿马尔科夫链进行转移,系统中的每种状态出现的概率将不会改变,这种收敛性与最初的初始状态无关,只与状态的转移概率有关,GIBBS采样是一种估算每一步转移概率的方法,经过该方法得到的转移概率最终的收敛概率等于目标概率,转移的状态被作为采样本,这种方法推算简单,收敛速度快,因此被广泛的用于估算各种联合分布、边缘分布。
对于Gibbs 采样,从条件概率采样往往比从边缘概率采样容易。设需要抽样的分布为p(X)=p(x1,x2,x3,...,xN),GIBBS采样对此概率的采样过程如下,给定X任意的初始值。
(1)从条件分布p(x1|xi-12,xi-13,...,xi-1N)中抽取样本xi1;
(2)从条件分布p(x2|xi1,xi-13,...
文档评论(0)