- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一’’’’。…’
要曼堡汉字识型.中多种细识别方法的综合集成
--_____-_●-I__一
席建民 方应谦 燕继坤
郑州市电子技术学院203教研室450004
摘要本文简述了手写体汉字识别的三种细识别算法,并采取细分类的串并混联模型
对三种方法进行综合集成.经过综合集成识别,提高了汉字的识别率.
关键词细识别、综合集成、识别算法
l引言
汉字独特的结构和繁多的笔划,使得手写汉字的计算机自动识别成为模式识别的一
个难题。为了解决它,各国的研究者们利用多种学科的理论,设计了许多识别方法。每一
种文字识别方法都有局限性,其识别精度和适用的范围是有一定限度的。但是,基于不同
特征抽取和匹配方法的分类器或多或少具有互补性,它们对相同数据的识别结果不会是完
全相同的·对多个分类器的识别结果进行集成可以弥补各个分类器的不足,提高总体性能。
这就是文字识别的综合集成技术,是智能系统综合集成理论的一个应用实例。目前已成为
文字识别研究的一个方向。
其实在手写体汉字识别研究的早期人们就已经想到集成各种相互独立的方法,以获得
更好的结果。例如,为了提高粗分类的正确率,把笔画方向特征和笔画密度特征结合起来
使用,等等。Mori等人在1984年就指出,各种简单的特征抽取方法的集成是手写体汉字
识别研究的一个趋势。不过那时的集成方法只是特征级的集成,还不是方法级的集成。由
于近年来手写体汉字识别研究在识别算法(指单字识别、不包括预处理和后处理)上并没
有实质性的进展,对现有的识别方法进行综合集成就成为一种突破手段。
2细识别的串并混联系统
由于汉字数量多,汉字识别从一开始就采用粗分类加细分类的两级策略。这种划分是
按照功能进行的。租分类的功能是用比较简单的特征快速地从整个汉字集合中挑选出可能
是正确的一组候选字。细分类的功能是用更为精细的特征和相对复杂的方法从候选字中识
别出正确的结果.它主要注重正确性;因为候选集较小,不太注重细识别时间.
并串模型是文字识别中使用最广泛的综合集成方法。它由两部分组成:并联部分是各
个细识别方法分别进行识别,串联部分是对各种识别结果进行综合分析,得到最满意的识
别结果。一般对并联识别结果集成的方法有三种:1.投票表决,2.利用候选字字号加
权捧序,3.利用各种候选字的距离(相似度)来判别.
串联模型的基本思想是:先用一种细识别方法进行识别,如果输出结果满足条件,则
输出结果。如果不能判定,进行第二级细识别,直到得到满意结果。
纽识别的并串模型和串联模型各有优缺点,并串模型由于对各种方法进行了综合分
析,因而识别率较高。并串模型的缺点是时间开销比较大.串联模型可以缩短识别时间。
经进对细识别模型进行了论述。发现并串模型识别率高,但时间开销大:串联模型速
一27—
度快,但识别率低。于是.我们设计了一个串并混联系统:首先依次用各种方法进行识别,
如果能得到满意的识别结果,则输出结果,并终止识别;如果直到最后一级仍不能判定,
则对前面的多种方法进行综合集成得到识别结果.串并混联模型综合了解以前几种模型的
优点,从识别时间和识别率两方面得到提高。
本文中,利用重心f回格法。基于汉字方向密度特征的识别,基于汉字基元之间的模糊
关系识别方法三种识别方法,设计了一个细识别的串并混联系统,该系统如下图所示:
下面对本系统采用的三种识别算法进行简要介绍.
3三种识别算法
{3.1重心罔格法识别手写体汉字
鸽.1.1重心网格的划分
经过规整化处理,待识汉字为一nxn的点阵图象,用I(i,j)矩阵表示.这里假设要
把I(i,j)划分为IXm(m为2的幂)个网格。
设当前处理区域的左界为L,右界为R,上界为U,+下界为D,重心为G(i,j).划分
时,从重心处将该区域分成四个网格,则:
∑∑I.,(J。,)
G=等锷L一
‘∑∑』(·,J)
∑∑j*l(ij)
G,=等锷一
。∑∑l(iJ)
I‘L,。U
按照上述方法可以将汉字点阵图象I(i,j)依次划分为所需要的网格.倒如,本系
统
文档评论(0)