基于统计与神经元方法相结合的手写体相似字识别.pdfVIP

基于统计与神经元方法相结合的手写体相似字识别.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于统计与神经元方法相结合的手写体相似字识别.pdf

中 文  信  息  学  报 第 13 卷 第 3 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 13 No. 3 基于统计与神经元方法相结合 的手写体相似字识别 张德喜  马少平  朱绍文  金奕江 华中师范大学电子与计算机研究所  武汉  430079 清华大学计算机科学与技术系  智能技术与系统国家重点实验室  北京  100084 摘要  本文提出了一种基于统计识别方法与人工神经元网络相结合的手写体相似汉字识 别方法 。该方法充分利用了统计识别方法和神经元网络识别方法的优点 ,不仅显著地提高了 相似字的识别率 ,而且有效地提高了系统的整体性能 。对相似字的识别率由 79 . 02 %提高到 84 . 32 % ,提高了五个百分点 ,整体识别率提高了 1. 3 个百分点 。 关键词  神经元网络  汉字识别  相似字识别 一 、问题的提出 近年来 ,汉字识别技术有了很大的发展 ,印刷体汉字识别 、联机手写体汉字识别技术基本 上已经成熟 ,在汉字输入中起着越来越重要的作用 。脱机手写体汉字识别 ,虽然在方法上不断 创新 ,识别率逐年提高 ,但由于其复杂性 ,距离人们普遍能接收的实用要求 ,还有一定的差距 。 其主要问题在于 ,每个人书写的汉字都有其各自的特点 ,差异性比较大 ,当识别率不高时 ,人们 的研究重点是如何将这些由不同人书写的、差异性比较大的相同汉字统一起来 ,找出它们之间 共同的部分 ,尽可能地消除这些差异 ,提高系统的总体识别率 。如文献[ 1~3 ] 采用整形变换和 模糊特征的方法 ,较好地解决了手写体汉字中的各种变形问题 ,使得识别率有了较大的提高 。 这种方法的特点是通过非线性变换和特征的模糊化 ,使得系统对汉字小范围的变换不敏感 ,从 而达到提高识别率的目的。其副作用是使得相似字更加难于区分了 ,虽然系统的整体识别率 有了很大的提高 ,但相似字的识别率却反而降低了。这是因为相似字间的差别是很小的 ,系统 在努力消除同一汉字不同写法间的差异性的同时 ,将相似字间的那些本来就很小的差别也消 除得所剩无几了。人工神经元网络方法在小规模分类中显示出很强的分类能力[5 ,6 ] ,在手写 体阿拉伯数字识别中也取得了较好的结果[7 ,8 ] 。经小规模的试验 ,神经元网络方法对手写体 相似字也具有比较满意的区分能力 。但 目前神经元网络方法存在的一个重要的问题是分类规 本文由国家自然科学基金和国家 863 高科技项 目资助 本文于 1999 年 1 月 7 日收到 33 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. 模问题 ,对于像数字识别这样的小规模分类问题 ,它显示出比较好的分类性能 ,随着规模的逐 步加大 ,其分类能力则急剧下降 , 以至于不能使用 。如何利用统计识别方法的大规模分类能 力 ,缩小识别范围 ,在小范围内利用人工神经元网络对相似字进行识别 ,是提高手写体汉字识 别水平的一个重要研究方向。 本文提出一种将传统的统计识别方法与人工神经元网络方法相结合的混合手写体汉字识 别方法 ,充分发挥统计识别方法整体识别率高和人工神经元网络方法对相似字区分能力强的 特点 ,使得相似字的识别率由原来的 79 . 02 %提高到 84 . 32 % ,提高了约 5 . 3 % 。 二 、相似字与相似字集 何为相似字 ? 并没有一个统一的定义 ,一般来说 ,相似字是指字形相近的汉字 。但对于汉 字识别来说 ,这样的定义并不全面 。因为

文档评论(0)

wuyouwulu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档