光学字符识别技术探究.ppt

下载文档 降价啦

6
0
约1.97千字
约 21页
2016-08-02 发布于湖北
举报
保障服务

光学字符识别技术探究.ppt

光学字符识别 OCR介绍 OCR（optical character recognition）文字识别[1] 是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。一个OCR识别系统，其目的很简单，只是要把影像作一个转换，使影像内的图形继续保存、有表格则表格内资料及影像内的文字，一律变成计算机文字，使能达到影像资料的储存量减少、识别出的文字可再使用及分析。可以极大减轻数据录入工作的强度，提高数据录入的速度。一．文字识别系统的构成。印刷体识别的原始图像是通过扫描仪、CCD器件或传真机等获得的二维灰度或二值图像，其识别过程如下图：进入OCR系统获取图像识别文稿校对结束图像预处理版式分析文本的切割特征提取单字识别后处理识别识别过程图像预处理版式分析文本的切割去噪声倾斜矫正二值化等段落表格图表文本切割字符切割特征提取统计特征结构特征单子识别特征库字库后处理词频结果纠正语义二．文字识别技术 OCR识别技术可分为印刷体识别技术和手写体识别技术，而后者由分为联机手写识别和脱机手写识别技术。联机手写识别脱机手写识别识别快出错多空间多更新

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

光学字符识别技术探究.ppt