- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第1页,共17页,星期日,2025年,2月5日概述由于有些场合,不能采用书写板等专用的输入设备输入文字,或文字信息已经是以手写体的形式存在,如果要利用计算机进行文字识别,就只能进行脱机手写体字符识别。第2页,共17页,星期日,2025年,2月5日OCR概念 OCR技术是光学字符识别(OpticalCharacterRecognition)的缩写,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。第3页,共17页,星期日,2025年,2月5日图像的输入原始文稿通过光电扫描仪或数码相机等输入设备转换成原始的二维图像信号,可以是彩色图像、灰度图像(grayscaleimage)或二值图像(binaryimage)。这个模块仅仅需要的是在获取图像过程中,尽可能的保证原始文稿的二维图像有比较好的质量,从而有利于后面识别模块的识别。第4页,共17页,星期日,2025年,2月5日预处理预处理是脱机手写识别系统中需要解决问题最多的一个模块。预处理通常包括以下几个过程:1、二值化2、消除干扰3、细化第5页,共17页,星期日,2025年,2月5日原图像二值化细化第6页,共17页,星期日,2025年,2月5日版面分析版面分析与理解是文字识别的前处理技术之一。它是利用图像处理、人工智能等技术完成文档图像文件中的文字域的分拣工作。其难度取决于版面的复杂程度,是文字识别系统提高实用化水平的主要技术指标之一。1、图像定位2、倾斜校正第7页,共17页,星期日,2025年,2月5日原图像校正后第8页,共17页,星期日,2025年,2月5日字符的分割1、行切割对于输入的二值化文字图像,首先要逐行地把各文字行图像切割出来,行切割的方法是:对二值化图像从上到下逐行扫描并同时计算每个扫描行的像素,以获取图像的水平投影,根据水平投影值确定文字行的位置,利用文字行间空白间隔造成的水平投影空白间隙,即可将各行文字分割出来2、字切割子切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙将单个汉字的图像切割开来。汉字的构造决定了字切割是更为困难的第9页,共17页,星期日,2025年,2月5日文字归一化1.位置归一化为了消除汉字点阵位置上的偏差,需要把整个汉字点阵图形移动到规定的位置上,这个过程被称作为位置归一化两种方法:1、基于质心的位置归一化2、基于文字外边框的位置归一化2.大小归一化对不同大小的文字做变换,使之成为同一尺寸大小的文字,这个过程被称做大小归一化。通过大小归一化,许多特征就能够用于识别不同字号混排的文字。两种方法:1、将文字的外边框按比例线性放大或缩小成为规定尺寸的文字2、根据水平和垂直两个方向文字黑像素的分布进行大小归一化第10页,共17页,星期日,2025年,2月5日特征提取稳定特征的抽取是整个识别系统的核心之一,它决定了识别系统的性能。用于脱机手写字符识别的统计特征,根据特征抽取屈居的不同可粗略地分为全局统计特征和局部统计特征两大类。全局统计特征是将整个汉字点阵作为研究对象,从整体上抽取特征。局部统计特征是将字符点阵图像分割成不同区域或网络,在各个小区域内分别抽取统计特征第11页,共17页,星期日,2025年,2月5日识别识别也即分类器的设计,良好性能的分类器的设计也是整个识别系统的核心之一,它直接决定了识别系统的性能。识别的方法很多,多方案集成是近年来文字识别领域的一个主要研究方向,任何一种特征、任何一种识别方法都有其优点和局限性,借鉴印刷体字符识别的成功经验,走多特征融合、多方案集成的道路,是脱机手写字符识别系统走向实用化的有效途径。第12页,共17页,星期日,2025年,2月5日
文档评论(0)