《OCR光学字符识别技术.docVIP

下载本文档

6
0
约 10页
2016-12-27 发布于北京
举报

《OCR光学字符识别技术.doc

1 OCR简介 OCR是英文Optical Character Recognition的缩写，意思是光学字符识别，也可简单地称为文字识别，是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息，利用各种模式识别算法分析文字形态特征，判断出汉字的标准编码，并按通用格式存储在文本文件中，从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机，就能通过OCR软件自动产生汉字文本文件，这与人手工键入的汉字效果是一样的，但速度比手工快几十倍。比如用手机给名片拍照，名片中的姓名、电话号码等信息就会自动识别进入到手机中，从此查询、拨打轻而易举。目前支持该功能的手机主要有摩托罗拉A1200、索爱P990和LG G832等。所以，OCR是一种非常快捷、省力的文字输入方式，也是在文字量比较大的今天，很受人们欢迎的一种输入方式。 2 OCR的发展概况 20世纪70年代初，日本的学者开始研究汉字识别，并做了大量的工作。我国研究汉字识别的起步比较晚，20世纪70年代末才开始进行OCR的研究工作。早期的OCR软件，由于识别率及产品化等多方面的因素，未能达到实际要求。同时，由于硬件设备成本高，运行速度慢，也没有达到实用的程度。只有个别部门，如信息部门、新闻出版单位等使用OCR软件。1 9

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

《OCR光学字符识别技术.docVIP