一种电子卷宗表格式OCR识别的方法.pdfVIP

  • 10
  • 0
  • 约1.56万字
  • 约 17页
  • 2023-05-17 发布于四川
  • 举报
本发明公开了一种电子卷宗表格式OCR识别的方法,包括以下步骤:图像预处理,包括图像二值化,灰度化,倾斜矫正;表格线检测,使用Canny进行边缘检测之后,采用形态学变换的方法分别提取横线图和竖线图,之后相交得到线图;单元格定位,根据交点,收缩点团,确定单元格顶点和对角点坐标;在Word上进行表格重绘;文字内容回填,训练文字识别引擎,切分单元格内容分别进行文字识别,最后回填入表格。本发明旨在处理电子卷宗OCR识别过程中对于带表格图像的处理,将表格转换为易于后续处理的Word文档格式,提高了其可修改性

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114782975 A (43)申请公布日 2022.07.22 (21)申请号 202210571646.X (22)申请日 2022.05.24 (71)申请人 南京大学 地址 210023 江苏

文档评论(0)

1亿VIP精品文档

相关文档