OCR字符识别简介–帮你认识OCR字符识别技术.docVIP

下载本文档

6
0
约1.64千字
约 3页
2017-06-08 发布于北京
举报
版权申诉

OCR字符识别简介–帮你认识OCR字符识别技术.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

OCR字符识别简介–帮你认识OCR字符识别技术

OCR字符识别简介 OCR是英文Optical Character Recoggnition的缩写，意思是光学字符识别，也可简单地成为文字识别，是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息，利用各种模式识别算法分析文字形态特征，判断出汉字的标准编码，并按通用格式存储在文本文件中，所以，OCR是一种非常快捷、省力的输入方式，也是在文字量较大的今天，很受人们欢迎的一种输入方式。 OCR的概念是在1929年由德国科学家Tausheck最先提出来的，后来美国科学家Handel也提出了利用技术对文字进行识别的想法。而最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy，1966年他们发表了第一篇关于汉字识别的文章，采用了模板匹配法识别了1000个印刷体汉字。直至1986年以后我国的OCR研究有了很大的进展，在汉字建模和识别方法上都有所创新，在系统研制和开发应用中都取得了丰硕的成果，不少单位相继推出了中文OCR产品。进入20世纪90年代以后，随着平台式扫描仪的广泛应用，以及我国信息自动化和办公自动化的普及，大大推动了OCR技术的进一步发展，使OCR的识别正确率、识别速度满足了广大用户的要求。目前，比较流行的OCR软件很多，英文OCR主要有OmniPage，中文OCR主要有云脉OCR、汉王OCR、清华文通OCR、中晶尚书OCR、丹青ORC、蒙恬OCR等。尽管汉字字量大、字形复杂，但OCR技术已经走向成熟。许多OCR软件不仅能识别黑白印刷体汉字，还能识别灰度和彩色印刷体汉字，识别速度很快，识别正确率达到了99%以上；可识别宋体、黑体、楷体等多种字体的简、繁体；可对多种字体、不同字号的混排进行识别；有些OCR软件还能识别图像、表格。与此同时，对于手写体汉字识别的研究也取得了很大进展，正确识别率已达到了70%以上。厦门云脉OCR在OCR识别应用软件上推出了证件识别、文档识别及拍照翻译等多种软件。其中，OCR识别应用软件——证件识别是一款基于Android系统的识别软件，可识别身份证、车牌等证件。无论是拍照、导入、识别、自动分类，还是核对信息、批量管理、导出表格，全程只在手机上完成。它的诞生彻底宣告了扫描、福音与手动录入时代的终结，无需任何硬件设备的辅助，轻松实现身份证、护照或户口簿及各式车牌信息的查询与批量管理。而OCR识别应用软件——文档识别则是利用手机摄像头拍摄文档（报纸、杂志、书本等）的图像的方式，自动识别图像上的文字信息，并可立即在线翻译，还可通过电邮、短信等方式分享发送给好友。远远超越电子此点的及时翻译功能，为学习或工作提供便利。OCR识别应用软件——拍照翻译则可以利用手机直接拍摄文档图像，划文字行或点选文字词进行快速自动文字识别，并按用户需要显示单字、词组的翻译结果，并可直接在谷歌上搜索关键字；同时支持直接在视频状态下取词翻译，识别结果和翻译结果可立即通过电邮、短信等方式分享给好友。汉王OCR涵盖票据、表格、单证识别系统等。应用步骤包括资料整理——扫描——图像处理——版面分析——识别——校对——数据入库。可自动进行版面理解并定位，判别划框选区域是横排文本区、竖排文本区、表格还是图像区，自动版面分析在后台运行。操作人员可在前台进行确认，必要时对自动版面分析结果加入手工干预。将文字图像转化为计算机文字内码，可以识别印刷体中文（包括简体字和繁体字）表格、中英文混排，识别出来的文字内码有GB码、BIG5码、GBK码。识别过程在后台运行。OCR录入资料数据库经由扫描录入、图像处理、版面分析、识别、纵校、横校、版面还原的工序处理最终形成。汉王OCR识别可以提供表格数据之间的逻辑和算数运算关系，并针对表格形成设计了独特的处理功能，能够满足各种复杂的表格识别要求，并且支持数据入库前的修改，确保最终的入库数据符合要求。