- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概述
由于有些场合,不能采用书写板等专用的输入设备输入文字,或文字信息已经是以手写体的形式存在,如果要利用计算机进行文字识别,就只能进行脱机手写体字符识别。
OCR概念
OCR技术是光学字符识别(Optical Character Recognition)的缩写,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
图像的输入
原始文稿通过光电扫描仪或数码相机等输入设备转换成原始的二维图像信号,可以是彩色图像、灰度图像(grayscale image)或二值图像(binary image)。这个模块仅仅需要的是在获取图像过程中,尽可能的保证原始文稿的二维图像有比较好的质量,从而有利于后面识别模块的识别。
预处理
预处理是脱机手写识别系统中需要解决问题最多的一个模块。预处理通常包括以下几个过程:
1、二值化
2、消除干扰
3、细化
原图像
版面分析
版面分析与理解是文字识别的前处理技术之一。它是利用图像处理、人工智能等技术完成文档图像文件中的文字域的分拣工作。其难度取决于版面的复杂程度,是文字识别系统提高实用化水平的主要技术指标之一。
1、图像定位
2、倾斜校正
原图像
字符的分割
1、行切割
对于输入的二值化文字图像,首先要逐行地把各文字行图像切割出来,行切割的方法是:对二值化图像从上到下逐行扫描并同时计算每个扫描行的像素,以获取图像的水平投影,根据水平投影值确定文字行的位置,利用文字行间空白间隔造成的水平投影空白间隙,即可将各行文字分割出来
2、字切割
子切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。
基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。
汉字的构造决定了字切割是更为困难的
文字归一化
1.位置归一化
为了消除汉字点阵位置上的偏差,需要把整个汉字点阵图形移动到规定的位置上,这个过程被称作为位置归一化
两种方法:1、基于质心的位置归一化 2、基于文字外边框的位置归一化
2.大小归一化
对不同大小的文字做变换,使之成为同一尺寸大小的文字,这个过程被称做大小归一化。通过大小归一化,许多特征就能够用于识别不同字号混排的文字。
两种方法:1、将文字的外边框按比例线性放大或缩小成为规定尺寸的文字
2、根据水平和垂直两个方向文字黑像素的分布进行大小归一化
特征提取
稳定特征的抽取是整个识别系统的核心之一,它决定了识别系统的性能。
用于脱机手写字符识别的统计特征,根据特征抽取屈居的不同可粗略地分为全局统计特征和局部统计特征两大类。
全局统计特征是将整个汉字点阵作为研究对象,从整体上抽取特征。
局部统计特征是将字符点阵图像分割成不同区域或网络,在各个小区域内分别抽取统计特征
识别
识别也即分类器的设计,良好性能的分类器的设计也是整个识别系统的核心之一,它直接决定了识别系统的性能。
识别的方法很多,多方案集成是近年来文字识别领域的一个主要研究方向,任何一种特征、任何一种识别方法都有其优点和局限性,借鉴印刷体字符识别的成功经验,走多特征融合、多方案集成的道路,是脱机手写字符识别系统走向实用化的有效途径。
后处理
文本识别后处理是指对单字识别的结果,利用词义、语义等上下文先验信息进行识别结果的确认或纠错。通常,在识别实际文本时,需要对单字识别的结果进行基于上下文关系的识别后处理。利用后处理技术,应该能够实现对单字识别结果的确认或纠错,并进一步区分相似字。
脱机手写体字符识别系统结构
手写识别中存在的问题及困难
由于手写变形的存在,使得手写体中相似字符的区分比印刷体要困难的多,因不同人书写风格的差异造成手写字符的变形很大,具体变现在以下几个方面:
(1)基本笔画变化。横不平,竖不直,直笔变弯,折笔的拐角变成圆弧等。(2)笔画模糊,不规范,该连的不连,不该连的却相连。(3)笔画与笔画之间、部件与部件之间的位置发生变化。(4)笔画的倾斜角、笔画的长短、部件的大小发生变化。(5)对于脱机手写字符,不同人使用不同的书写笔可能造成笔画的粗细变化。
参考文献
[1]张宏林 Visual C++数字图像模式识别技术及工程实践(第二版) 人民邮电出版社 2008.5
[2]陈念 一种基于复合特征的脱机手写体字符识别方法 自然科学报 2008.1
[3]宋佳
您可能关注的文档
最近下载
- 2025年三元食品面试题目及答案.doc VIP
- PEP小学英语五年级上册第三单元测试卷(含听力材料及标准答案).doc VIP
- 万里路测试题及答案.doc
- township梦想小镇攻略-价格-时间-配方表.xls VIP
- 35kV输电线路工程施工强制性条文执行检查表.pdf VIP
- 2025年第三节 妊娠剧吐.pptx VIP
- 2025年第三季度预备党员入党积极分子思想汇报材料.docx VIP
- 医学课件-综合医院中西医结合科(中医科)人员配置和人才培养.pptx VIP
- TCRHA 089-2024 成人床旁心电监测护理规程.pdf VIP
- 傅里叶变换红外光谱-傅里叶红外光谱课件.pptx VIP
原创力文档


文档评论(0)