电器铭牌图片中关键词识别与`输出.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电器铭牌图片中关键词识别与`输出

电器铭牌图片中关键词识别及输出   [摘 要]电器铭牌图片中文字风格不一、排版格式复杂多样,在智能终端OCR文字识别软件基础上,研究出一种对图像中关键词按需识别及输出的操作流程,开发测试相关功能软件,扩展智能终端OCR应用场景 [关键词]电器铭牌、文字识别OCR、智能终端、图片按需识别 中图分类号:TM76 文献标识码:B 文章编号:1009-914X(2016)16-0108-01 一、问题 电器铭牌提供了电器设备的品牌、产品名称、型号等参数,在客户服务中,根据用户提供的设备铭牌信息,厂商或服务商能够迅速了解用户设备可能的问题。智能手机具有拍照功能,用户获取设备铭牌图片后,需及时把铭牌图片中关键文字识别出来,这样用户就能够准确提供电器设备信息,反馈给厂商。由于各种电器铭牌风格差异很大,采用现有文档OCR(Optical Character Recognition,光学字符识别)识别系统、特定(名片、票据等)的格式化OCR识别系统无法满足众多电器铭牌识别要求 二、背景综述 OCR 是指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。如何除错或利用辅助信息提高识别正确率是OCR最重要的课题,一个OCR系统主要性能指标有拒识率、误识率、识别速度、用户界面友好性、产品稳定性、易用性及可行性等 OCR软件主要由图像输入、预处理、版面分析、字符切割、字符识别、版面恢复、后处理、校对等功能组成 1、图像输入,不同的图像有不同的存储格式、不同的压缩方式,目前有JPEG、PDF、IMG等图像格式 2、预处理包括二值化、噪声去除、倾斜校正等。(1)二值化,摄像头拍摄的彩色图像所含信息量巨大,图像内容可以简单地分为前景与背景,为让计算机更快更好地识别文字,需对彩色图进行处理,使图片只含前景信息与背景信息,简单地定义前景信息为黑色,背景信息为白色,这就是二值化图。(2)噪声去除,对不同文档定义不同噪声特征,根据噪声的特征进行去噪,就叫做噪声去除。(3)倾斜校正,用户在拍照或扫描文档时,很难完全平直,拍照出来的图片不可避免地产生倾斜,对倾斜图像进行拉直,使图像整体达到平直 3、版面分析,将文档图片分段落、分行的过程就叫做版面分析,由于实际文档的多样性、复杂性,因此没有一个固定的、最优的切割模型 4、字符切割,由于拍照条件所限,造成字符粘连、断笔,限制了识别系统性能,这就需要文字识别软件有字符切割功能 5、字符识别,字符识别方法有多种,早期有模板匹配,后来以特征提取为主。特征分为两类:一类为统计特征,如文字区域内的黑/白点数比,当文字区分成好几个区域时,这一个个区域黑/白点数比之联合,就成了空间的一个数值向量,在比对时,基本的数学理论就足够。另一类为结构特征,如文字影像细线化后,取得字的笔划端点、交叉点之数量及位置,或以笔划段为特征,配合特殊的比对方法,进行比对。当输入文字算完特征后,不管是统计或结构的特征,都有一比对数据库或特征数据库来进行比对,数据库的内容应包含所有欲识别的字集文字,根据与输入文字一样的特征抽取方法所得的特征群组 6、版面恢复,对识别后的文字,像原文档图片那样,段落不变、位置不变、顺序不变地输出到word文档、pdf文档等 7、后处理、校对,根据特定的语言上下文的关系,对识别结果进行校正 OCR技术为现有纸介质文字的数字化提供了批量录入手段,对特定格式图片的内容识别,让OCR在发票管理、名片管理等行业获得了广泛应用。国内OCR技术方案提供商包括汉王、文通、合合等 鉴于图片文档的复杂多样,版面分析没有固定、最优的切割模型,本研究项目提出由用户根据图片实际情况,按需选择图片中多个关键词进行识别,以图片属性或文件名方式输出识别结果,以解决无特定字符排版格式的图片中关键词识别,扩大OCR技术在更多场景下的应用 三、方案设计 电器铭牌图片,必需的关键词为厂商品牌、产品名称、产品型号,可选的关键词为设备电气参数、出厂日期、序列号 原始图像输入后,经过预处理,得到一个可用于识别的图像。版面分析阶段,用户在终端设备上适当放大图像,并移动图像到字符需识别的位置,用户用矩形框选择待识别区域,然后进行字符切割、字符识别,在选择区域的输出框中看到识别结果,确认是否正确。若正确无误,输出到关键词框中,若不正确,提示重新选择待识别区域,以确保得到正确的识别结果。接着移动图像到下一个字符需识别的位置,用户用矩形框选择待识别区域,然后进行字符切割、字符识别。所有关键词识别后,保存关键词到图像文件的属性,用关键词另存成新的图像文件名 软件操作流程(图1): 铭牌图片输入、图片预处理、图片关键

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档