- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN113705313B(45)授权公告日2025.07.08
(21)申请号202110374315.2
(22)申请日2021.04.07
(65)同一申请的已公布的文献号申请公布号CN113705313A
(43)申请公布日2021.11.26
(73)专利权人腾讯科技(深圳)有限公司
地址518044广东省深圳市南山区高新区
科技中一路腾讯大厦35层
(72)发明人张慧黄珊
(74)专利代理机构北京同达信恒知识产权代理有限公司11291
专利代理师朱佳
(51)Int.CI.
GO6V30/41(2022.01)
GO6V30/14(2022.01)
GO6V30/166(2022.01)
GO6V30/19(2022.01)
GO6V10/82(2022.01)
GO6N3/044(2023.01)
GO6N3/0464(2023.01)
GO6N3/08(2023.01)
(56)对比文件
CN111753827A,2020.10.09审查员杨霜雪
权利要求书4页说明书20页附图10页
(54)发明名称
文本识别方法、装置、设备及介质
S21
S21
获取待识别图像
S22
从待识别图像中提取出待识别文本区域
采用已训练的目标文本识别模型,获得待识别文本区域对应的目标视觉特征,
目标文本识别模型是对待训练的文本识别模型和注意力编解
码模型进行联合训练获得的,待训练的注意力编解码模型的
输入为待训练的文本识别模型中卷积网络的输出
采用目标文本识别模型,
对目标视觉特征进行解码操作,获得待识别文本区域的文本识别结果
S23
CN113705313B(57)摘要本申请提供一种文本识别方法、装置、设备及介质,涉及人工智能技术领域,用于提高文本识别的效率,该文本识别方法中,通过目标文本识别模型提取待识别图像中待识别文本区域中的目标视觉特征,并对目标视觉特征进行解码,以获得文本识别结果,无需对目标视觉特征进行深度编码,以提高文本识别的效率,且,由于目标文本识别模型是借助注意力编解码模型进行训练得到的,使得目标文本识别模型可以学习更具
CN113705313B
(57)摘要
CN113705313B权利要求书1/4页
2
1.一种文本识别方法,其特征在于,包括:
获取待识别图像;
从所述待识别图像中提取出待识别文本区域;
采用已训练的目标文本识别模型,获得所述待识别文本区域对应的目标视觉特征,并对所述目标视觉特征进行解码操作,获得所述待识别文本区域的文本识别结果;
其中,所述已训练的目标文本识别模型,是对待训练的文本识别模型和注意力编解码模型进行联合训练获得的,其中,所述待训练的注意力编解码模型的输入为所述待训练的文本识别模型中卷积网络的输出,其中,所述目标文本识别模型是采用以下方式训练获得的:
分别从样本图像集中各个样本图像中,提取出相应的样本文本区域,获得样本文本区域集合;
基于所述样本文本区域集合,对所述待训练的文本识别模型进行多轮迭代训练,直到满足模型收敛条件为止,其中,所述文本识别模型还包括解码网络,每一轮迭代训练包括以下操作:
将从所述样本文本区域集合中选取的各个样本文本区域输入所述卷积网络,分别提取所述各个样本文本区域各自的样本视觉特征;
将获得的各个样本视觉特征分别输入所述解码网络和所述注意力编解码模型,分别获得所述各个样本文本区域各自对应的第一预测文本标签分布和第二预测文本标签分布;
基于获得的各个第一预测文本标签分布,确定所述待训练的文本识别模型的第一训练损失,以及基于获得的各个第二预测文本标签分布,确定所述注意力编解码模型的第二训练损失;
基于所述第一训练损失和所述第二训练损失,确定联合训练损失,并基于所述联合训练损失,对所述文本识别模型进行参数调整。
2.如权利要求1所述的方法,其特征在于,所述将获得的各个样本视觉特征输入所述解码网络,获得所述各个样本文本区域
您可能关注的文档
- CN112706931B 无人机燃油供油系统及供油、加油控制方法 (西安九天航空科技有限公司).docx
- CN112784469B 模型参数生成方法、装置、电子设备和可读存储介质 (广州虎牙科技有限公司).docx
- CN112883680B 制造包括纳米片的集成电路的方法和计算系统 (三星电子株式会社).docx
- CN112911799B 一种低寄生参数功率模块的封装结构及封装方法 (武汉羿变电气有限公司).docx
- CN112993059B 太阳能电池叠层钝化结构及制备方法 (韩华思路信株式会社).docx
- CN113011596B 一种模型自动更新方法、装置、系统及电子设备 (阳光保险集团股份有限公司).docx
- CN113049879B 近场通信设备以及检测其谐振频率的方法 (三星电子株式会社).docx
- CN113066183B 虚拟场景生成方法、装置、计算机设备和存储介质 (腾讯科技(深圳)有限公司).docx
- CN113160035B 一种基于姿态引导、风格和形状特征约束的人体图像生成方法 (浙江工业大学).docx
- CN113169370B 用于制造电极堆叠体的方法和设备 (大众汽车股份公司).docx
- 广东省东莞市2024-2025学年八年级上学期生物期中试题(解析版).pdf
- 非遗剪纸文创产品开发经理岗位招聘考试试卷及答案.doc
- 广东省东莞市2024-2025学年高二上学期期末教学质量检查数学试题.pdf
- 体育安全理论课件图片素材.ppt
- 3.1 公民基本权利 课件-2025-2026学年道德与法治八年级下册 统编版 .pptx
- 广东省潮州市湘桥区城南实验中学等校2024-2025学年八年级上学期期中地理试题(解析版).pdf
- 大数据运维工程师岗位招聘考试试卷及答案.doc
- 广东省深圳市福田区八校2026届数学八年级第一学期期末教学质量检测模拟试题含解析.doc
- 广东省潮州市湘桥区城基初级中学2024-2025学年八年级上学期11月期中考试数学试题(解析版).pdf
- 广东省潮州市湘桥区城西中学2024-2025学年八年级上学期期中地理试题(解析版).pdf
最近下载
- 第1单元第5课计算机操作系统-(河南科技出版社)豫科版(2020)七年级信息技术上册教学设计.docx VIP
- D-Z-T 0382-2021 固体矿产勘查地质填图规范(正式版).docx VIP
- 春考山东真题数学试卷.docx VIP
- 国开(电大)行管本科《政府经济学》期末考试试题及部分答案 .pdf VIP
- 材料构配件进场检验记录.pdf
- 山东春考建筑类模拟试卷含答案.pdf VIP
- 《海关与海关法》课件.pptx VIP
- 四川省南充市2024-2025学年高一上学期期末质量检测语文试题(含答案).pdf VIP
- 办公设备维保服务服务质量与保证措施.doc VIP
- 《历史学专业导论》课程教学大纲.docx VIP
原创力文档


文档评论(0)