自然场景图像中的文本检测方法研究.pdfVIP

自然场景图像中的文本检测方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自然场景图像中的文本检测方法研究 李东勤王芳周万怀 (安徽财经大学管理科学与工程学院,安徽蚌埠233030) 摘 要:研究自然场景中的文本检测与定位方法,总结文本检测的研究现状,并对主流算法进行了分类和对比。 关键词:自然场景图像;文本检测;文本定位;文本/非文本分类 中图分类号:TP317 文献标识码:A 文章编号:1673—1980(2016)06—0108—04 从自然场景图像中自动提取其中的文字信息, 乎不会引起几何变形;而自然场景中的图像,受移动 成为计算机视觉、模式识别、文档分析识别等技术方 终端设备的拍摄角度、光照均匀度等因素影响,会发 向的一个研究热点。自然场景文字提取与识别技术 生几何变形或透视变形等。 在基于内容的图像检索、智能交通、智能翻译、视频 自然场景图像虽比较复杂,但自然场景下的文 内容分析等领域应用广泛。自然场景图像中的文本 本特征仍有规律可循: 提取包括3个核心技术:文本检测与定位、文本分割 (1)文本的笔画特征。笔画是文本图像的一个 与增强、文本识别。文本检测与定位技术用于确定 显著特征,与背景存在较大差异,其宽度、纹理、颜色 自然场景图像中文本的位置,并找出这些文本的边 及强度都与背景大不相同。笔画信息可作为自然场 界。文本分割技术用于去除文本周围的背景,从而 景图像中文本检测与定位的一个重要特征。 简化后面的文本识别问题。对分割之后的文本作进 (2)文本的颜色和亮度。自然场景图像中的文 一步增强非常重要,因为自然场景图像中的文本很 本颜色、亮度与其背景相差较大,很容易发现及辨 多时候分辨率很低、模糊且有噪声。文本识别是对 识。尽管有些场景中文本颜色与背景相近,但文本 前面处理之后的图像进行识别,从而最终得到相应 的边缘与背景必然明显可分,否则人眼也无法认知 的文本信息。 这些文本。文本颜色与亮度可作为自然场景中文本 检测与定位的另一个重要特征。 1 文本检测问题难点 2文本检测与定位算法研究 传统的光学字符识别(OCR)软件仅用于文档 图像。文档图像一般通过高精度扫描得到,具有分 研究人员提出的多种复杂场景文本检测定位算 辨率高、背景简单等特点,文字识别的难度较小。相 法,总体可分为4类:基于连通区域的方法、基于纹 比之下,自然场景图像更加复杂,文本检测与定位更 理的方法、基于边缘的方法和基于机器学习的方法。 加困难。 2.1基于连通区域的方法 普通文档布局格式通常相对固定,内容以字符为 采用基于连通区域分析的方法,首先需假设同 主;而自然场景图像中的文本没有明显的布局特征与 一区域的字符具有相似的颜色和亮度,并且与背景 规律可循,可能在图像中任何不确定的位置出现。 区域的颜色存在较大差异,可采用自底向上的方法 普通文档图像背景通常比较单一,往往为白底 从图像中提取连通区域;然后利用几何约束构造启 黑字;而自然场景图像中的文本背景错综复杂,可出 发式规则进行连通域分析,合并子区域,得到最终的 ‘ 现颜色的变化、噪声的叠加及光照亮度的变化等。 文本区域。 普通文档图像一般是由光电扫描设备获得,几 收稿日期:2016—08—26 基金项目:国家自然科学基金项目“基于近红外光谱学的机采籽棉杂质含量快速检测方法研究”;安徽财经大学 2016年度校级

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档