复杂场景文本段识别.PDFVIP

  • 10
  • 0
  • 约2.58万字
  • 约 5页
  • 2020-01-26 发布于天津
  • 举报
复杂场景文本段识别.PDF

/article/02-2019-10-039.html 计算机应用研究 复杂场景文本段识别 王孝男,张 利,何思楠 (清华大学 电子工程系, 北京 100084) 摘 要:针对背景复杂或者存在字符黏连时文本段图片无法准确切分的情况进行了研究,提出了一种复杂场景文本段 识别方法。该方法利用图像和文字序列的相关性设计双向递归神经网络对图像特征序列进行编码,然后设计集成的连 接时间分类(CTC )和注意力(attention )模块对编码特征进行解码输出。该算法在多个数据集(公开数据集ICDAR2013 和ICDAR2003 以及验证码数据集)上进行测试,得到识别准确率分别为90.2%,87.4%和92.5%,从而证明了该算法 的有效性。实验结果对文本段识别和应用有重要意义。 关键词:文本段识别;连接时间分类;注意力;

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档