- 0
- 0
- 约3.24万字
- 约 7页
- 2026-06-03 发布于山东
- 举报
测控技术
模式识别与人工智能2022年第41卷第7期・17・
一种端到端的自然场景文本检测与识别模型
陈鹏,李鸣,张宇*,王志鹏
(南昌大学信息工程学院,江西南昌330000)
摘要:提出了一种结合卷积神经网络和递归神经网络的有效的端到端场景文本识别方法。首先使用特
征金字塔(FPN)提取图像的多尺度特征,然后将引入残差网络(ResNet)的深度双向递归网络(Bi-
LSTM)对这些特征进行编码,获得文本序列特征,进而引入注意力机制(Attention)对文本序列特征进行
解码达到识别效果。在ICDAR2013JCDAR2015数据集实验验证了该算法的有效性,该方法不仅降低
了训练难度,而且提升了网络的收敛速度,提高了文本识别准确率。该方法的有效性在ICDAR2013、IC-
DAR2015数据集上得到了充分验证。
关键词:特征金字塔;卷积
您可能关注的文档
最近下载
- 锅炉日常运行记录表.docx VIP
- 新闻宣传培训课件.pptx VIP
- 2026年医卫类执业兽医-临床科目(全科)参考题库含答案解析(5套题答案).docx VIP
- GBT50493-2019石油化工可燃气体和有毒气体检测报警设计标准(完整正版清晰无水印)OCR.pdf VIP
- 远洋渔业无人机辅助探鱼、渔场环境监测应用与经济效益分析.docx VIP
- 职业兽医师试题及答案.docx VIP
- 中投顾问:2026-2030年中国固态电池行业深度分析报告.pdf VIP
- 中级会计实务教材电子书 -中级实务电子教材.docx VIP
- 安徽省合肥市庐阳区45中学2026届中考三模英语试题含答案.doc
- 简体中文版 ACI 318-14 结构混凝土建筑规范 及 解说 4.pdf VIP
原创力文档

文档评论(0)