CN114581646B 文本识别方法、装置、电子设备及存储介质 (深圳须弥云图空间科技有限公司).docxVIP

CN114581646B 文本识别方法、装置、电子设备及存储介质 (深圳须弥云图空间科技有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN114581646B(45)授权公告日2025.07.11

(21)申请号202111485442.6

(22)申请日2021.12.07

(65)同一申请的已公布的文献号申请公布号CN114581646A

(43)申请公布日2022.06.03

(73)专利权人深圳须弥云图空间科技有限公司地址518054广东省深圳市南山区粤海街

道海珠社区滨海大道3369号有线信息传输大厦25F2504

(72)发明人蒋召黄泽元杨战波祁晓婷

(74)专利代理机构北京嘉科知识产权代理事务所(特殊普通合伙)11687

专利代理师杨超

(51)Int.CI.

GO6V10/22(2022.01)

GO6V10/25(2022.01)

GO6V10/44(2022.01)

GO6V10/82(2022.01)

GO6N3/0464(2023.01)

GO6N3/08(2023.01)

(56)对比文件

CN113205049A,2021.08.03

CN111985464A,2020.11.24

审查员马金驹

权利要求书2页说明书9页附图2页

(54)发明名称

文本识别方法、装置、电子设备及存储介质

(57)摘要

CN114581646B本说明书实施例提供一种文本识别方法、装置、电子设备及存储介质。方法包括:利用水印检测网络对待识别图像进行检测,得到水印类型以及水印检测框,并选择水印去除模型,利用水印去除模型对水印检测框中的水印进行去除,得到无水印图像;利用文本检测网络对无水印图像进行文本检测,得到无水印图像中文本框的位置,基于文本框的位置对文本框进行裁剪,得到文本框;将文本框作为文本识别网络的输入,利用卷积神经网络层对文本框进行特征提取得到第一特征图,并利用循环神经网络层对第一特征图进行处理得到第二特征图,利用转录层对第二特征图进行转录,得到待识别图像中的文本。本公开提

CN114581646B

S101

S101

获取待识别图像,利用水印检测网络对待识别图像进

行检测,得到水印类型以及水印检测框,并确定与水

印类型相匹配的水印去除模型,利用水印去除模型对

水印检测框中的水印进行去除,得到无水印图像

S102

利用文本检测网络对无水印图像执行文本检测操作,

得到无水印图像中文本框的位置,基于文本框的位置

对文本框进行裁剪,得到文本框

S103

将文本框作为文本识别网络的输入,利用卷积神经网

络层对文本框进行特征提取得到第一特征图,并利用

循环神经网络层对第一特征图进行处理得到第二特征

图,利用转录层对第二特征图进行转录,得到待识别

图像中的文本

CN114581646B权利要求书1/2页

2

1.一种文本识别方法,其特征在于,包括:

获取待识别图像,利用水印检测网络对所述待识别图像进行检测,得到水印类型以及水印检测框,并确定与所述水印类型相匹配的水印去除模型,利用所述水印去除模型对所述水印检测框中的水印进行去除,得到无水印图像;

利用文本检测网络对所述无水印图像执行文本检测操作,得到所述无水印图像中文本框的位置,基于所述文本框的位置对所述文本框进行裁剪,得到所述文本框;

将所述文本框作为文本识别网络的输入,利用卷积神经网络层对所述文本框进行特征提取得到第一特征图,并利用循环神经网络层对所述第一特征图进行处理得到第二特征图,利用转录层对所述第二特征图进行转录,得到所述待识别图像中的文本;

其中,所述确定与所述水印类型相匹配的水印去除模型,包括:

当所述待识别图像中的水印为印章时,利用预设的印章去除模型,对所述待识别图像中的印章进行去除;

当所述待识别图像中的水印为透明水印时,利用预设的透明水印去除模型,对所述待识别图像中的透明水印进行去除;

当所述待识别图像中的水印为印章和透明水印时,依次利用预设的印章去除模型和透明水印去除模型,对所述待识别图像中的印章以及透明水印进行去除;

所述利用卷积神经网络层对所述文本框进行特征提取得到第一特征图,并利用循环神经网络层对所述第一特征图进行处理得到第二特征图,利用转录层对所述第二特征图进行转录,得到所述待识别图像中的文本,包括:

利用所述卷积神经网络层中的主干网络对所述文本框执行卷积操作,并将主干网络输出的特征图输入到连续的深度混合卷积块中,利

您可能关注的文档

文档评论(0)

xm + 关注
实名认证
文档贡献者

专业学习资料,专业文档

1亿VIP精品文档

相关文档