图像汉字识别方法及原理的研究.docxVIP

下载本文档

20
0
约1.4万字
约 14页
2017-01-18 发布于安徽
举报

图像汉字识别方法及原理的研究.docx

1.2研究现状及存在问题汉字识别技术自六十年代开始有人从事研究。IBM公司的凯瑟和纳吉最先开始研究印刷体汉字识别，并且发表了关于汉字识别的第一篇文章。中国较晚开始进行汉字识别的研究70年代初先开始研究英文字母、数字等方面的文字识别，汉字识别的研究是从70年代末开始的，到1986年中国的汉字识别研究有了一定的阶段性进展。20世纪90年代之后，我国扫描仪的广泛使用以及办公自动化技术的不断提高，大大推动了汉字识别技术的发展。目前，印刷体汉字是技术已经取得了较为显著的成果，对高分辨率图像和无特效的文字图像有较好的识别效果，识别率可以达到98%以上，如“汉王OCR”、“紫光OCR”等。但当图像中的汉字在字体、大小、排版、对齐方式等方面变化，且图像分辨率低、背景复杂时，OCR软件的识别率就会大大下降。由文献[4]可知，目前汉字识别系统主要包括预处理、字符分割、特征提取、匹配识别等阶段。整个过程包括载入图像后，进行预处理得到二值图像，通过不同的途径使获得汉字图像的干扰因素降到最低，然后进行行和列的字符分割，将文字分割出来，然后使用各种汉字图像的模式识别算法，提取汉字的特征，最后与标准汉字匹配，识别图像中的中文文本。针对复杂背景下的汉字识别，文献[5]针对SIFT(Scale Invariant Feature Transform)算法的优势，提出了一种新的SSIFT(Shape-SIFT)算子，

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

图像汉字识别方法及原理的研究.docxVIP