- 10
- 0
- 约1.56万字
- 约 17页
- 2023-05-17 发布于四川
- 举报
本发明公开了一种电子卷宗表格式OCR识别的方法,包括以下步骤:图像预处理,包括图像二值化,灰度化,倾斜矫正;表格线检测,使用Canny进行边缘检测之后,采用形态学变换的方法分别提取横线图和竖线图,之后相交得到线图;单元格定位,根据交点,收缩点团,确定单元格顶点和对角点坐标;在Word上进行表格重绘;文字内容回填,训练文字识别引擎,切分单元格内容分别进行文字识别,最后回填入表格。本发明旨在处理电子卷宗OCR识别过程中对于带表格图像的处理,将表格转换为易于后续处理的Word文档格式,提高了其可修改性
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114782975 A
(43)申请公布日 2022.07.22
(21)申请号 202210571646.X
(22)申请日 2022.05.24
(71)申请人 南京大学
地址 210023 江苏
您可能关注的文档
最近下载
- 2025年天津市春季高考英语真题卷含答案解析.docx VIP
- JB∕T 5088.2-2018 内燃机 旋装式机油滤清器 第2部分:试验方法.docx VIP
- 女性体态改造课件.pptx VIP
- 2026 年山东省高职(专科)单独招生文化素质考试模拟样卷.docx VIP
- 第六章扩散(材料科学基础).ppt
- 女性塑形课件.pptx VIP
- 最新平行线的性质判定专项练习40题.docx VIP
- JB∕T 5088.1-2018 内燃机 旋装式机油滤清器 第1部分:技术条件.docx VIP
- 南京铁道职业技术学院单招职业技能题库及答案.docx VIP
- 2026年河北唐山辅警考试题库附答案.docx VIP
原创力文档

文档评论(0)