- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1OCR简介
OCR是英文OpticalCharacterRecognition的缩写,意思是光学字符辨认,也可简朴地称为文字辨认,是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,运用各种模式辨认算法分析文字形态特性,判断出汉字的标准编码,并按通用格式存储在文本文献中,从主线上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文献,这与人手工键入的汉字效果是同样的,但速度比手工快几十倍。比如用手机给名片拍照,名片中的姓名、电话号码等信息就会自动辨认进入到手机中,从此查询、拨打轻而易举。目前支持该功能的手机重要有摩托罗拉A1200、索爱P990和LGG832等。所以,OCR是一种非常快捷、省力的文字输入方式,也是在文字量比较大的今天,很受人们欢迎的一种输入方式。
2OCR的发展概况
20世纪70年代初,日本的学者开始研究汉字辨认,并做了大量的工作。我国研究汉字辨认的起步比较晚,20世纪70年代末才开始进行OCR的研究工作。初期的OCR软件,由于辨认率及产品化等多方面的因素,未能达成实际规定。同时,由于硬件设备成本高,运营速度慢,也没有达成实用的限度。只有个别部门,如信息部门、新闻出版单位等使用OCR软件。1
986年以后我国的OCR研究有了很大进展,在汉字建模和辨认方法上都有所创新,在系统研制和开发应用中都取得了丰硕的成果,不少单位相继推出了中文OCR产品。
进入20世纪90年代以后,随着平台式扫描仪的广泛应用,以及我国信息自动化和办公自动化的普及,大大推动了OCR技术的进一步发展,使OCR的辨认对的率、辨认速度满足了广大用户的规定。
目前,比较流行的OCR软件很多,英文OCR重要有OmniPage,中文OCR重要有清华紫光OCR、清华文通OCR、汉王OCR、中晶尚书OCR、丹青OCR、蒙恬OCR等。尽管汉字字量大、字形复杂,但OCR技术已经走向成熟。许多OCR软件不仅能辨认黑白印刷体汉字,还能辨认灰度和彩色印刷体汉字,辨认速度不久,辨认对的率达成了99%以上;可辨认宋体、黑体、楷体等多种字体的简、繁体;可对多种字体、不同字号的混排进行辨认;有些OCR软件还能辨认图像、表格。与此同时,对于手写体汉字辨认的研究也取得了很大进展,对的辨认率已达成了70%以上。
3OCR系统的组成
汉字辨认软件OCR的功能是将各种录入汉字、印刷体或手写体中每个汉字的图形或图像通过计算机辨认出来,并标出汉字类别代码。因此,汉字辨认归根结底是一个图像辨认问题。由于汉字信息量很大,具有不同的字形、字体,并且结构复杂,因此汉字辨认的过程极其复杂。由于扫描仪的普及与广泛应用,OCR软件只需提供与扫描仪的接口,运用扫描仪驱动软件即可。因此,OCR软件重要是由图像解决模块、版面划分模块、文字辨认模块和文字编辑模块等4部分组成。
1)图像解决模块
图像解决模块重要具有文稿扫描、图像缩放、图像旋转等功能。通过扫描仪输入后,文稿形成图像文献,图像解决模块可对图像进行放大,去除污点和划痕,假如图像放置不正,可以手工或自动旋转图像,目的是为文字辨认发明更好的条件,使辨认率更高。
2)版面划分模块
版面划分模块重要涉及版面划分、更改划分,即对版面的理解、字切分、归一化等,可选择自动或手动两种版面划分方式。目的是告诉OCR软件将同一版面的文章、表格等分开,以便于分别解决,并按照如何的顺序进行辨认。
3)文字辨认模块
文字辨认模块是OCR软件的核心部分,文字辨认模块重要对输入的汉字进行阅读,但不能一目多行,必须逐行切割,对于汉字通常也是一个字一个字地辨认,即单字辨认,再进行归一化。文字辨认模块通过对不同样本汉字的特性进行提取,完毕辨认,自动查找可疑字,具有前后联想等功能。
4)文字编辑模块
文字编辑模块重要对OCR辨认后的文字进行修改、编辑,如系统辨认认为有误,则文字会以醒目的红色或蓝色显示,并提供相似的文字供选择,选择编辑器供输出等。
4OCR辨认的一般环节
(1)文稿扫描后,刚开始出现在视窗中的要辨认的文字画面很小,一方面选择放大工具,对画面进行适当放大,以使画面看得更清楚。必要时还可以选择缩小工具,将画面适当缩小。
(2)假如画面需要旋转90°,180°或270°,可使用旋转图像工具旋转图像。假如文字画面倾斜,可选择倾斜校正工具,将画面调正。
(3)辨认时选择设定辨认区域工具,在文字画面上框出要辨认的区域,这时也可根据画面情况框出多个区域。假如所框区域有误,则可使用删除辨认区域工具,删除所选辨认区域。
(4)为了提高辨认率,假如所选辨认区有杂点或有不能辨认的图像,则可选择擦除
您可能关注的文档
- 路基路面工程复习题二本.doc
- 餐饮部员工绩效管理考核统计表.doc
- 护理人员岗位职能职责.doc
- 综合项目施工升降机安拆专项方案.doc
- 锅炉水冷壁换管拆除安装专项方案.doc
- 稳恒电流和电路.pptx
- 2024年声级计项目可行性分析报告.docx
- 2024年飞行试验地面设备项目可行性分析报告.docx
- 大学生消费结构调查专题计划书.doc
- 盗梦空间镜头运用方式及意义.doc
- 我国室内装修环境污染人身损害法律适用困境与突破研究.docx
- 新疆草地植物多样性的水热密码:类型分化与关联机制.docx
- 多源流理论视角下中国新型农村合作医疗政策制定的逻辑与启示.docx
- 转录因子TWIST1在子痫前期发病中的多维度解析:作用、机制与临床意义.docx
- 地震作用下碎石土斜坡的损伤与破坏机制:理论、实验与数值模拟.docx
- 直线滚动导轨副静动态特性的多维度探究与应用解析.docx
- 稀土掺杂CaO与CaSc₂O₄的能量传递机制及发光特性解析.docx
- 贵州德江县香树坪滑坡形成机制的深度剖析与探究.docx
- 探究基因多态对氯乙烯作业工人染色体损伤风险的影响:机制、关联与防护策略.docx
- 木犀草素对无机汞致小鼠急性肝损伤的干预效应与机制探究.docx
原创力文档


文档评论(0)