图像汉字识别方法及原理的研究.docxVIP

  • 20
  • 0
  • 约1.4万字
  • 约 14页
  • 2017-01-18 发布于安徽
  • 举报
1.2研究现状及存在问题汉字识别技术自六十年代开始有人从事研究。IBM公司的凯瑟和纳吉最先开始研究印刷体汉字识别,并且发表了关于汉字识别的第一篇文章。中国较晚开始进行汉字识别的研究70年代初先开始研究英文字母、数字等方面的文字识别,汉字识别的研究是从70年代末开始的,到1986年中国的汉字识别研究有了一定的阶段性进展。20世纪90年代之后,我国扫描仪的广泛使用以及办公自动化技术的不断提高,大大推动了汉字识别技术的发展。目前,印刷体汉字是技术已经取得了较为显著的成果,对高分辨率图像和无特效的文字图像有较好的识别效果,识别率可以达到98%以上,如“汉王OCR”、“紫光OCR”等。但当图像中的汉字在字体、大小、排版、对齐方式等方面变化,且图像分辨率低、背景复杂时,OCR软件的识别率就会大大下降。由文献[4]可知,目前汉字识别系统主要包括预处理、字符分割、特征提取、匹配识别等阶段。整个过程包括载入图像后,进行预处理得到二值图像,通过不同的途径使获得汉字图像的干扰因素降到最低,然后进行行和列的字符分割,将文字分割出来,然后使用各种汉字图像的模式识别算法,提取汉字的特征,最后与标准汉字匹配,识别图像中的中文文本。针对复杂背景下的汉字识别,文献[5]针对SIFT(Scale Invariant Feature Transform)算法的优势,提出了一种新的SSIFT(Shape-SIFT)算子,

文档评论(0)

1亿VIP精品文档

相关文档