- 3
- 0
- 约2.06万字
- 约 18页
- 2023-09-06 发布于四川
- 举报
本发明公开了一种基于端到端网络的场景文本识别方法,包括以下步骤:S1:构建深度学习的端到端文本识别网络,端到端文本识别网络包括特征提取层、编码层和解码层;S2:特征提取层添加卷积块注意力模块,并采用基于卷积注意力的残差网络对文本图像进行特征提取;S3:编码层引入细粒度特征编码,采用长短期记忆网络对细粒度特征进行编码,获得上下文特征编码序列;S4:解码层引入自注意力机制,添加自注意力模块加强文本图像的全局特征,对文本特征进行增强与转录;S5:确定端到端文本识别网络的损失函数和网络结构参数,训练网络
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 116704483 A
(43)申请公布日 2023.09.05
(21)申请号 202310569945.4 G06N 3/045 (2023.01)
原创力文档

文档评论(0)