- 0
- 0
- 约7.12千字
- 约 7页
- 2023-07-05 发布于四川
- 举报
本发明公开了一种将文档识别并自动建立数据库的系统及方法,包括:判断模块,用于识别文件类型;OCR图像识别模块,用于提取图片类资料的中的文字内容,OCR图像识别模块包含图像预处理单元、文本检测单元、文字识别单元和后处理单元;实体识别模块,用于对文本资料进行分析归类,并将归类的文本导入至数据库;搜索模块,用于搜索特定的实体;文档撰写模块,用于撰写文档。有益效果:采用了OCR技术和基于深层神经网络的命名实体识别技术,可对导入的文字或图片等内容识别,识别后根据实体的基本信息建立数据库对文件内容归类与整理
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113806368 A
(43)申请公布日 2021.12.17
(21)申请号 202111087046.8
(22)申请日 2021.09.16
(71)申请人 上海晏鼠计算机技术股份有限公司
您可能关注的文档
最近下载
- 2025江苏航运职业技术学院单招考试文化素质数学过关检测试卷及完整答案详解(精选题).docx VIP
- 钢筋混凝土化粪池22S702.pdf VIP
- 2025年铁岭卫生职业学院单招职业技能考试题库学生专用.docx
- 2025年宜宾中考物理试卷及答案.doc VIP
- 掩体构筑教学法教案.doc VIP
- 神经网络与深度学习.pdf VIP
- 2026年全国国家版图知识竞赛题库(含答案).pdf VIP
- 心血管-肾脏-代谢综合征(CKM)综合管理中国专家共识2025解读PPT课件.pptx VIP
- AQ2013-2008金属非金属地下矿山通风技术规范.pdf VIP
- 广东省初中学业水平考试数学试卷试题及答案(2025年).pdf VIP
原创力文档

文档评论(0)