CN119598971A 一种基于深度学习和版面分析的pdf提取方法和系统（上海人工智能创新中心）.docxVIP

下载本文档

1
0
约1.45万字
约 21页
2026-05-25 发布于山西
举报

CN119598971A 一种基于深度学习和版面分析的pdf提取方法和系统（上海人工智能创新中心）.docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119598971A

(43)申请公布日2025.03.11

(21)申请号202411443154.8

(22)申请日2024.10.16

(71)申请人上海人工智能创新中心

地址200232上海市徐汇区云锦路701号

37、38层

(72)发明人徐超王斌王莎莎李薇何聪辉

(74)专利代理机构上海科盛知识产权代理有限

公司31225

专利代理师夏健君

(51)Int.Cl.

G06F40/109(2020.01)

G06N5/02(2023.01)

G06F40/151(2020.01)

G06V30/148(2022.01)

G06V30/416(2022.01)

G06V30/412(2022.01)

G06F16/353(2025.01)

权利要求书2页说明书7页附图3页

(54)发明名称

一种基于深度学习和版面分析的PDF提取方

法和系统

(57)摘要

CN119598971A本发明涉及一种基于深度学习和版面分析的PDF提取方法和系统，包括：获取PDF文件，对于扫描版文件和文字版文件分别通过OCR技术和深度学习模型进行元素识别，元素包括文本、图片、表格和公式；根据识别出的元素，将PDF文件的页面划分为多个逻辑块，并确定层

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

CN119598971A 一种基于深度学习和版面分析的pdf提取方法和系统（上海人工智能创新中心）.docxVIP