- 7
- 0
- 约2.8千字
- 约 7页
- 2018-10-13 发布于福建
- 举报
利用双层PDF技术实现地质的资料信息化管理
利用双层PDF技术实现地质的资料信息化管理
摘 要:本文介绍了双层PDF技术的实现方法及操作技巧,旨在通过建立索引数据库实现对地质资料的信息化管理。在已扫描地质资料数据基础上,通过OCR识别生成文本与图像相结合的可检索PDF文件,100%保留原档案资料版面效果,实现文档的检索、复制等功能,提高地质文档电子化发展。
关键词:双层PDF OCR 地质资料 信息化
中图分类号:G27 文献标识码:A 文章编号:1672-3791(2017)10(a)-0014-02
目前,河北省地质档案馆的全部资料已经完成了图文扫描,数字化的数据为地质资料信息化发展提供了重要的数据资源。数字化的地质资料用于阅读虽然极大地提高了效率,但是目前所有的数字图文资料还不能够进行全文检索,数字化资料深层化的利用和解析还没有起到一定的作用。
因此,在现有数字化数据的基础上,开展OCR(Optical Character Recognition)识别,使之转化为双层PDF文件,并形成全文数据库,实现地质资料和数据的全面检索,促进地质资料由静态查阅向数字化信息管理发展。
1 双层PDF转换方法及流程
目前国内双层PDF转换技术已相对成熟,在现有技术条件下,大体可分为三种:软件转换、流程加工、识别重构。地质资料数字化双层PDF?D换主要运用第一种方法进行软件转换,即经过软件自动
您可能关注的文档
最近下载
- 国际私法学(西南政大)中国大学MOOC慕课 章节测验期末考试答案.docx VIP
- 第4课 洋务运动和边疆危机 课件(共25张PPT).pptx VIP
- 《热工基础与应用(第3版)》傅秦生(电子课件)试题2.docx VIP
- 资料课件教程摔跤吧爸爸.pdf VIP
- 特岗教师小学信息技术试题.docx VIP
- NB_T 10087-2018 陆上风电场工程施工安装技术规程.docx VIP
- 2025年成都市金牛区网格员考试题库(附答案).docx VIP
- 2026年1月浙江省普通高校招生选考物理试卷+答案解析.pdf
- 2026年人教版七年级英语下册期末检测卷(二) 附答案解析 (1).docx VIP
- T_CEPPEA 5028-2023 陆上风力发电机组预应力预制混凝士塔筒施工与质量验收规范.pdf VIP
原创力文档

文档评论(0)