- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
轻松识别文字,这款Python OCR库支持超过80种言语
有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。
所以说,OCR作用是对文本材料的图像文件进行分析识别处理,猎取文字及版面信息。
OCR的全称叫作“Optical Character Recognition”,即光学字符识别。
这算是生活里最常见、最有用的AI应用技术之一。
细心观看便可发觉,身边处处都是OCR的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。
OCR本质是图像识别,其包含两大关键技术:文本检测和文字识别。
先将图像中的特征的提取并检测目标区域,之后对目标区域的的字符进行分割和分类。
关于EasyOCR
Python中有一个不错的OCR库-EasyOCR,在GitHub已有9700star。它可以在python中调用,用来识别图像中的文字,并输出为文本。
?
/JaidedAI/EasyOCR
?
EasyOCR支持超过80种言语的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,将来会支持更多的言语。
安装EasyOCR
安装过程比较简约,使用pip或者conda安装。
pip?install?easyocr
假如用的PyPl源,安装起来可能会耽搁些时间,建议大家用清华源安装,几十秒就能安装好。
使用方法
EasyOCR的用法格外简约,分为三步:
1.创建识别对象;
2.读取并识别图像;
3.导出文本。
我们先来举个简约的例子。
找一张路标图片,保存到电脑:
接着撸代码:
#?导入easyocrimport?easyocr#?创建reader对象reader?=?easyocr.Reader([ch_sim,en])?#?读取图像result?=?reader.readtext(test.jpg)#?结果result
输出结果:
可以看到路标上的三个路名以及拼音都识别出来了!
识别的结果包含在元组里,元组由三部分组成:边框坐标、文本、识别概率。
「关于言语:」
这段代码有一段参数[ch_sim,en],这是要识别的言语列表,由于路牌里有中文和英文,所以列表里添加了ch_sim(简体中文)、en(英文)。
可以一次传递多种言语,但并非全部言语都可以一起使用。英语与每种言语兼容,共享公共字符的言语通常相互兼容。
前文我们给出了EasyOCR支持的言语列表,并附有参数代号。
「关于图像文件:」
上面传入了相对路径test.jpg,还可以传递OpenCV图像对象(numpy数组)、图像字节文件、图像URL。
再读取一张文字较多的旧事稿图片:
#?导入easyocrimport?easyocr#?创建reader对象reader?=?easyocr.Reader([ch_sim,en])?#?读取图像result?=?reader.readtext(test1.jpg)#?结果result
识别文字的精确?????率还是很高的,接下来对文字部分进行抽取。
for?i?in?result:????word?=?i[1]????print(word)
输出:
小结
该开源库是作者争辩了几篇论文,复现出来的成果,真是一位实干家。
检测部分使用了CRAFT算法,识别模型为CRNN,它由3个次要组件组成:特征提取,序列标记(LSTM)和解码(CTC)。整个深度学习过程基于Pytorch实现。
作者一直在完善EasyOCR,后续方案一方面扩展支持更多的言语,争取掩盖全球80%~90%的人口;另一方面支持手写识别,并提高处理速度。
-----------
您可能关注的文档
最近下载
- 外研版(孙有中2024版)小学英语三年级上册U6 My sweet home Period1 Welcome to my home优质课比赛课件.ppt VIP
- 城市遥感知识学习.ppt VIP
- 2025年教科版(2024)小学科学二年级上册(全册)教学设计(附目录).docx
- 工程机械租赁投标方案、技术方案.docx VIP
- 中药临方炮制的现状及进展.pdf
- 港口工程初步设计文件编制规定,JTS110-4-2008.pdf VIP
- 水处理生物过程.ppt VIP
- 克莱门特w3000用户手册(中文版).pdf VIP
- 仪表及自动控制设备管理规定.pdf VIP
- 毕业设计-电动叉车设计.docx VIP
文档评论(0)