基于人工智能的表格识别方法、装置及电子设备.pdf

基于人工智能的表格识别方法、装置及电子设备.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 110796031 A (43)申请公布日 2020.02.14 (21)申请号 201910965184.8 (22)申请日 2019.10.11 (71)申请人 腾讯科技(深圳)有限公司 地址 518000 广东省深圳市南山区高新区 科技中一路腾讯大厦35层 (72)发明人 李鑫  (74)专利代理机构 深圳市隆天联鼎知识产权代 理有限公司 44232 代理人 刘抗美 (51)Int.Cl. G06K 9/00(2006.01) G06F 40/18(2020.01) G06F 40/174(2020.01) 权利要求书3页 说明书19页 附图14页 (54)发明名称 基于人工智能的表格识别方法、装置及电子 设备 (57)摘要 本公开提供了一种基于人工智能的表格识 别方法、基于人工智能的表格识别装置以及电子 设备,主要涉及计算机视觉、自然语言处理和机 器学习等技术。该方法包括:基于图像语义对待 识别图像进行图像分割以得到前景线条图像;根 据所述前景线条图像中的线条关系确定多个表 格单元格,并根据所述多个表格单元格建立电子 表格;对所述待识别图像进行文本识别以得到所 述待识别图像中的文本信息;根据所述文本信息 在所述待识别图像中的位置以及所述表格单元 格在所述电子表格中的位置,将所述文本信息填 A 充至所述电子表格中。该方法通过对表格结构与 1 表格内容进行分割、识别、再组合的方式可以避 3 0 6 免二者在识别过程中的相互干扰,从而可以提高 9 7 0 表格的识别准确性。 1 1 N C CN 110796031 A 权 利 要 求 书 1/3页 1.一种基于人工智能的表格识别方法,其特征在于,包括: 基于图像语义对待识别图像进行图像分割以得到前景线条图像; 根据所述前景线条图像中的线条关系确定多个表格单元格,并根据所述多个表格单元 格建立电子表格; 对所述待识别图像进行文本识别以得到所述待识别图像中的文本信息; 根据所述文本信息在所述待识别图像中的位置以及所述表格单元格在所述电子表格 中的位置,将所述文本信息填充至所述电子表格中。 2.根据权利要求1所述的基于人工智能的表格识别方法,其特征在于,所述根据所述前 景线条图像中的线条关系确定多个表格单元格,包括: 对所述前景线条图像进行线条拟合以确定多个图像线条; 根据各个所述图像线条之间的位置关系确定多个由所述图像线条相交形成的线条交 点; 根据各个所述线条交点之间的位置关系确定多个以所述线条交点为顶点的表格单元 格。 3.根据权利要求2所述的基于人工智能的表格识别方法,其特征在于,所述图像线条包 括沿第一方向分布的横向线条和沿第二方向分布的纵向线条;所述对所述前景线条图像进 行线条拟合以确定多个图像线条,包括: 利用横向线条卷积核对所述前景线条图像进行卷积处理以得到横向线条图像; 在所述横向线条图像中确定多个沿第一方向分布的第一像素连通区域; 分别对各个所述第一像素连通区域中的像素点进行线条拟合以确定多个横向线条; 利用纵向线条卷积核对所述前景线条图像进行卷积处理以得到纵向线条图像; 在所述纵向线条图像中确定多个沿第二方向分布的第二像素连通区域; 分别对各个所述第二像素连通区域中的像素点进行线条拟合以确定多个纵向线条。 4.根据权利要求3所述的基于人工智能的表格识别方法,其特征在于,所述根据各

文档评论(0)

10301556 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档