- 2
- 0
- 约2.42万字
- 约 20页
- 2023-06-06 发布于四川
- 举报
本发明公开了一种基于CTC的图像文字识别方法及装置,包括:基于训练好的文字识别模型识别目标图像中的文字,得到目标图像对应的原文字集合,该原文字集合包括从目标图像中识别出的至少一个原文字;将每个原文字转换成对应的向量,并将所有原文字对应的向量输入预先训练好的语义纠正模型,得到每个原文字对应的预测文字;将所有原文字对应的预测文字确定为目标图像的文字识别结果;其中,该文字识别模型为基于连接时序分类CTC的文字识别模型。可见,本发明能够基于文字识别模型与语义纠正模型的组合实现对图像文字的识别,在识别图像
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112766052 A
(43)申请公布日 2021.05.07
(21)申请号 202011600857.9
(22)申请日 2020.12.29
(71)申请人 有米科技股份有限公司
原创力文档

文档评论(0)