脱机手写字符识别概述-中文翻译.doc

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
脱机手写字符识别概述-中文翻译

脱机手写字符识别概述 Nafiz Arica and Fatos T. Yarman-Vural 摘要:在最近的半个世纪里,字符识别已经被广泛地研究,并且发展到了一个足够的水平来提出一个有实际应用的技术。现在,快速发展的计算能力使当前的字符识别方法论的实现成为可能,随着越来越多新兴领域的出现,也产生了不断增长的需求,这些需求要求更高深的方法论。 这份材料可以作为字符识别领域的工作人员的一个向导,或者作为一个阅读材料的最新资料。首先,这里介绍的是字符识别系统的历史进程。然后,介绍的是各种有效字符识别技术的优点和缺点。最后,讨论了字符识别的现状和一些将来字符识别研究的建议。在这份材料里,特别关注的是离线手写识别技术,这是因为这个领域的技术需要更多的研究——来达到“机器模拟人类阅读”这一最终的目标。 索引词:字符识别、特征提取、离线手写识别、分割、训练和识别。 I.前言 随着电子计算机的出现,机器模拟人脑功能已经成为一个非常具有挑战性的研究领域。在某些需要一定的智力才能完成的区域(诸如数字处理、人机对弈),已经取得了巨大的改进。另一方面,在相对常规的功能上,例如视觉,人类仍然优于具有最强计算能力的计算机。机器模拟人类阅读就是其中的一个领域,这已经成为了最近三十年里深入研究的课题;虽然离最终的目标还有很长的路要走。 在这篇概述里,字符识别被用作一个涵盖性术语——包含了在各个应用领域机器字符识别的各种类型。这篇概述可以作为字符识别领域的现状的最新资料,注重讨论的是在新兴领域里不断增长的需求所呼唤的方法论,例如电子图书馆的发展、多媒体数据库以及手写识别素材系统所要用到的技术。本文研究了字符识别研究的方向,分析了各个系统所使用的方法论的限制条件。这些字符识别系统可以被分为两方面:1)数据获取过程(在线、离线) 2)字符文本类型(印刷、手写)。无论问题属于哪个方面,一般来说,字符识别问题有五个主要的阶段: 1)预处理 2)分割 3)表示形式(表示方法) 4)训练和识别 5)后处理 这篇论文是,从字符识别系统的各个阶段回顾字符识别方法论,而不是全面的研究。虽然离线和在线字符识别技术有不同的方法,但它们也有一些共同的难题和解决方案。由于比在线字符识别、印刷字符识别需要更复杂,并且需要更多的深入研究,离线字符识别被选择为这篇文章讨论的重点。然而,这篇文章也回顾了一些在线字符识别的方法论,因为它和离线字符识别有一定的联系。 离线字符识别的历史回顾和发展情况在第II部分给出,离线字符识别系统的方法论在第III部分给出。最后,未来的研究方向和讨论将在第IV部分给出。由于不可能引用成千上万的多力研究来覆盖字符识别领域,我们只提供了一些精挑细选的参考文献,来避免详尽的研究列表,你可以在文章的末尾来查看这些信息。关于离线和在线手写识别的全面综合的研究可以参考文献【141】,【162】的研究专注于离线手稿字符识别方法论,【124】介绍的著作可以作为进入现在各种字符识别研究领域的一个很好的切入点。 II.历史 写作,在几个世纪以来,已经成为收集、保存和传达信息最自然的方式。现在,写作不仅用来在人与人之间交流信息,而且也用来在人与机器之间交流信息。对字符识别领域的深入研究,不仅是因为模拟人类阅读所具有的挑战性,还因为这项技术在一些方面所带来的高效应用,例如越来越大数量的论文自动处理、向机器传递信息以及论文文档到因特网接口。在历史上,字符识别系统的进化可分为三个阶段。 1900-1980 早期阶段:字符识别的历史可以追溯到1900年,当时俄罗斯科学家Tyuring试图给视觉上有残疾的人提供协助。伴随着数字化电子计算机的发展,第一个字符识别器出现在1945年左右。自动字符识别的早期工作已经集中在印刷体、规范手写体字符方面。在那个时代,印刷体字符识别系统一般使用模板匹配的方法,一副图像会和图像库里的所有图像进行比较。对于手写字符文本,低灰阶图像处理技术已经应用在二值图像上,从而提取出特征向量,然后特征向量再提供给统计学分类器。成功,但有一定约束条件的算法已经被实现用来识别拉丁字母和数字。另一方面,在日本、中国、希伯来、斯拉夫、希腊和阿拉伯,基于印刷体和手写体字符和数字识别,正处在启蒙阶段。 50年代,商业上有效的字符识别器终于浮出水面,当时电子输入板抓取笔尖在X-Y坐标系的数据的技术第一次被引入。这一创新使研究人员开始了在线手写识别的工作。一个很好的关于在线识别的参考文献(1980年以前的技术)可以再【163】找到。 1980-1990 发展阶段:1980年以前,研究人员深受这样的困扰:没有强大的计算硬件和数据获取设备。随着信息技术的爆炸式发展,除了字符识别系统,其它的应用领域的方法论也在一个非常肥沃的环境中快速发展【18】【54】【170】。基于结构的方法和基于统计

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档