CN119693950A 一种基于版面分析的ocr提取优化方法 (天清数安(天津)科技有限公司).docxVIP

  • 3
  • 0
  • 约6.74千字
  • 约 11页
  • 2026-06-12 发布于山西
  • 举报

CN119693950A 一种基于版面分析的ocr提取优化方法 (天清数安(天津)科技有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119693950A

(43)申请公布日2025.03.25

(21)申请号202510208945.0

(22)申请日2025.02.25

(71)申请人天清数安(天津)科技有限公司

地址300110天津市南开区科研东路西侧

天津科技广场

(72)发明人石琦王晓邸小丽

(74)专利代理机构北京鼎云升知识产权代理事务所(普通合伙)11495

专利代理师张捷

(51)Int.Cl.

G06V30/14(2022.01)

G06V30/166(2022.01)

G06V30/168(2022.01)

G06V30/41(2022.01)

权利要求书1页说明书4页附图1页

(54)发明名称

一种基于版面分析的OCR提取优化方法

(57)摘要

CN119693950A本发明公开一种基于版面分析的OCR提取优化方法,涉及信息处理技术领域,包括以下步骤:图像数据预处理、图像版面布局检测、识别并区分区域大小、对各区域进行OCR文本提取、按顺序读取并拼接文本;本发明通过对图像的像素优化处理,可显著提升后续OCR识别和版面布局分析的效果,并结合布局检测与OCR,依照坐标进行大小区域区分并进行相关的处理,实现对复杂排版的图像的信息抽取,能准确保持原有的文本顺序和结构

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档