- 0
- 0
- 约3.33万字
- 约 28页
- 2023-06-04 发布于四川
- 举报
本发明提供了一种通用文档识别方法,获取文档中一个或多个文字字段的文字信息,所述文字信息包括:文本内容和文本边界框;获取文档中一个或多个文字字段所一一对应的类别信息,所述类别信息至少包括:主键字段类别Key和值字段类别Value;获取类别为Key的文字字段与其他文字字段之间的连接关系;基于所述连接关系,获取与类别为Key的文字字段和/或与类别为Key的文字字段相连或不相连的类别为Value的文字字段,作为所述类别为Key的文字字段对应的结构化内容,确定所述结构化内容的类别信息和文字信息,完成对文档
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112699234 A
(43)申请公布日 2021.04.23
(21)申请号 202011439241.8
(22)申请日 2020.12.08
(71)申请人 上海
原创力文档

文档评论(0)