一种端到端的自然场景文本检测与识别模型.pdfVIP

  • 0
  • 0
  • 约3.24万字
  • 约 7页
  • 2026-06-03 发布于山东
  • 举报

一种端到端的自然场景文本检测与识别模型.pdf

测控技术

模式识别与人工智能2022年第41卷第7期・17・

一种端到端的自然场景文本检测与识别模型

陈鹏,李鸣,张宇*,王志鹏

(南昌大学信息工程学院,江西南昌330000)

摘要:提出了一种结合卷积神经网络和递归神经网络的有效的端到端场景文本识别方法。首先使用特

征金字塔(FPN)提取图像的多尺度特征,然后将引入残差网络(ResNet)的深度双向递归网络(Bi-

LSTM)对这些特征进行编码,获得文本序列特征,进而引入注意力机制(Attention)对文本序列特征进行

解码达到识别效果。在ICDAR2013JCDAR2015数据集实验验证了该算法的有效性,该方法不仅降低

了训练难度,而且提升了网络的收敛速度,提高了文本识别准确率。该方法的有效性在ICDAR2013、IC-

DAR2015数据集上得到了充分验证。

关键词:特征金字塔;卷积

文档评论(0)

1亿VIP精品文档

相关文档