基于GABP神经网络脱机手写藏文识别方法.docVIP

下载本文档

1
0
约3.44千字
约 8页
2018-06-23 发布于福建
举报
版权申诉

基于GABP神经网络脱机手写藏文识别方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于GABP神经网络脱机手写藏文识别方法

基于GABP神经网络脱机手写藏文识别方法　　摘要：通过对当前流行的各种识别技术进行分析比较，在对藏文手写体特征展开深入研究的基础上，考虑到将来的研究趋势及可扩展性，提出了一套基于手写藏文识别的技术方法，即基于GABP神经网络的藏文识别方案，并着重对手写藏文识别中的特征提取和分类器设计进行了分析，提出了藏文识别领域今后的发展方向。　　关键词：脱机手写藏文识别；GABP神经网络；特征提取　　中图分类号：TP317.2 文献标识码：A 文章编号2013）009007902 　　基金项目：青海省普通高等学校研究生创新项目　　作者简介：梁会方（1987-），女，青海师范大学计算机学院硕士研究生，研究方向为藏文信息处理。　　0引言　　模式识别在各个领域中的应用非常多，从这些应用中可以看到它们的共性，即一个模式识别系统通常包括原始数据的获取和预处理、特征提取与选择、分类或聚类、后处理4个主要部分。其中藏文识别需要解决的关键问题是模式分类，其理论基础是模式识别技术，其中最常用的方法是统计模式识别方法和结构模式识别方法。近年来也有很多人将隐马尔科夫模型用于手写识别领域，取得了良好的效果。本文主要介绍统计模式识别、结构模式识别以及使用较多的隐马尔科夫模型和人工神经网络模型。　　1模式识别　　1.1统计模式识别　　统计模式识别是依据统计的原理来建立分类器，其分类器设计方法主要有贝叶斯决策理论和判别函数。贝叶斯决策理论基本思想为：在类条件概率密度和先验概率已知或者可以估计的条件下，利用贝叶斯公式比较样本属于两类的后验概率，然后将类别决策为后验概率大的一类，从而使总体错误率最小。常见的一种贝叶斯决策为最小错误率贝叶斯决策[1]，其决策规律如下：　　如果P（w＼-1|x）P（w＼-2|x），则x∈w＼-1；反之，则x∈w＼-2。　　通过贝叶斯公式，后验概率的比较可以转化为类条件概率密度的比较，离散情况下也是类条件概率的比较，而这种条件概率或条件密度则反映了在各类模型下观察到当前样本的可能性或似然度，因此可以定义两类之间的似然比或对数似然比进行决策。　　该??法的主要优点是抗干扰能力强，且易于实现，但是应用中的主要缺点是细分能力较弱，区分相似字的能力较差。　　1.2结构模式识别　　藏文文字结构复杂，但同时具有相当的规律性，这种文字都含有丰富的结构信息，因此可以获取这些组字的规律以及藏文字符信息的结构特征作为识别的依据。结构模式识别[2]的主要思想就是文字图像划分为很多基本组合，然后利用一些相似性度量准则确定出这些组合之间的关系，以及这些字符图像模式和一些典型模式之间利用一些相似性度量准则确定的相似程度。　　1.3隐马尔科夫模型　　HMM模型[3]是将特征值和一个状态转移模型联系起来，它是一个双重随机过程，其中状态转移过程是不可观察即隐藏的马尔科夫模型，而可观察事件的随机过程是隐藏状态转换过程的随机函数。HMM有3个基本问题及常用算法：①评估问题：前后向递推算法；②解码问题：Viterbi算法；③学习问题：BaumWelch算法。　　HMM模型可以用一种特定的神经网络模型来模拟[4]，该模型收敛性较差，易陷入局部极值。　　1.4人工神经网络模型　　神经系统是由大量神经细胞构成的复杂网络，是一个由大量简单的处理单元组成的高度复杂的大规模非线性自适应系统。神经网络是一个高度并行的分布处理结构，它是非线性的，具有自组织和自学习的能力。神经网络与传统的模式识别不同，能够直接输入数据并进行学习，用样本训练网络并实现识别。它是非参数的识别方法，不需要传统方法中的建模、参数估计以及参数校验、重新建模等复杂过程。　　在字符识别领域常用的网络模型有：BP网络、RBF网络、自组织网络、Hopfield网络、SVM网络等。　　BP网络是一种多层前馈网络[5]，是一种依靠反馈值来不断调整节点之间的连接权值而构建的一种网络模型。它由输入层、隐藏层、输出层相互连接构成，其结构如图1所示。　　网络的学习训练过程由信号的正向传播与误差的反向传播组成，其中正向传播是把输入样本从输入层输入，经各隐层处理后传向输出层，若输出层的实际输出和期望输出不符，则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传，并将误差分摊给各层的所有单元，从而获得各层单元的误差信号，此误差信号即作为修正各单元权值的依据。各层权值调整过程是周而复始地进行，直到网络输出的误差减少到可以接受的程度。　　2遗传算法改进的BP网络　　藏文字符识别是中国多文种信息处理系统的重要组成部分，脱机手写藏文识别在很多领域有广阔的使用前景。在现有汉字以及数字识别方法的基础上，提出了很多预处