一种通用文档识别方法、系统、终端及存储介质.pdfVIP

  • 0
  • 0
  • 约3.33万字
  • 约 28页
  • 2023-06-04 发布于四川
  • 举报

一种通用文档识别方法、系统、终端及存储介质.pdf

本发明提供了一种通用文档识别方法,获取文档中一个或多个文字字段的文字信息,所述文字信息包括:文本内容和文本边界框;获取文档中一个或多个文字字段所一一对应的类别信息,所述类别信息至少包括:主键字段类别Key和值字段类别Value;获取类别为Key的文字字段与其他文字字段之间的连接关系;基于所述连接关系,获取与类别为Key的文字字段和/或与类别为Key的文字字段相连或不相连的类别为Value的文字字段,作为所述类别为Key的文字字段对应的结构化内容,确定所述结构化内容的类别信息和文字信息,完成对文档

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112699234 A (43)申请公布日 2021.04.23 (21)申请号 202011439241.8 (22)申请日 2020.12.08 (71)申请人 上海

文档评论(0)

1亿VIP精品文档

相关文档