一种将文档识别并自动建立数据库的系统及方法.pdfVIP

  • 0
  • 0
  • 约7.12千字
  • 约 7页
  • 2023-07-05 发布于四川
  • 举报

一种将文档识别并自动建立数据库的系统及方法.pdf

本发明公开了一种将文档识别并自动建立数据库的系统及方法,包括:判断模块,用于识别文件类型;OCR图像识别模块,用于提取图片类资料的中的文字内容,OCR图像识别模块包含图像预处理单元、文本检测单元、文字识别单元和后处理单元;实体识别模块,用于对文本资料进行分析归类,并将归类的文本导入至数据库;搜索模块,用于搜索特定的实体;文档撰写模块,用于撰写文档。有益效果:采用了OCR技术和基于深层神经网络的命名实体识别技术,可对导入的文字或图片等内容识别,识别后根据实体的基本信息建立数据库对文件内容归类与整理

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113806368 A (43)申请公布日 2021.12.17 (21)申请号 202111087046.8 (22)申请日 2021.09.16 (71)申请人 上海晏鼠计算机技术股份有限公司

文档评论(0)

1亿VIP精品文档

相关文档