五、科技成果资料字化进展.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五、科技成果资料字化进展

五、科技成果资料数字化进展 国土资源科技成果是国家经济建设非常宝贵的信息资源,大部分是由国家出资开展的基 础性、公益性和战略性基础资料和数据,具有很强的公益性特点,社会影响面和社会需求比 较广泛。另外,国土资源部的科研机构大多属于社会公益类科研机构,从事的工作以向全社 会提供公共技术和服务为主,因此国土资源科技成果具有很强的社会共享特征。部科技成果 管理办公室已保存了自 1980-2010 年登记的 11285 项科技成果资料,包括地质调查、土地调 查、信息技术及国土资源管理等各领域的成果,自国土资源部成立以来,每年的成果登记数 量以 200 项左右在增加。随着现代信息社会的发展和广大用户对国土资源信息的需求,我们 开展了国土资源部科技成果资料数据库建设,对科技成果资料进行数字化,使成果资料安全、 长期保存,并且得到深度开发和广泛利用。 (一)成果资料数字化背景 项目开始于 2007 年,2010 年结束,完成了 1980-2010 年登记的11285 项科技成果数字 化扫描工作。主要包括第一期对地质矿产部时期近 9 千项成果资料扫描后文件以图像形式存 储,成果报告存储 PDF 格式;第二期对国土资源部成立以来的 1 千多项成果报告及专著扫描 后进行矢量化,存储成双层 PDF 格式。成果资料数字化共完成数据量 1300G, 其中A4 文档 约 132 万页(双层 PDF文档 19 万页),A3 以上图幅 7 万幅。现已全部上传到中心服务器。 同时为更好满足广大用户对国土资源信息查询的更高要求,更好地开展网络环境下的社 会化服务,加快成果的推广转化,在数字国土资源工程的统一要求下,开展了科技成果资料 数据库建设,主要建设内容包括在已有的成果资料目录查询的基础上,对科技成果资料增加 部分核心元数据和扩展元数据查询,完成数据库的科技成果索引(划分领域、编写关键词、编 写成果项目摘要);对 1980 年以来的全部科技成果编写关键词、项目摘要,划分八大领域。 八大领域分别是基础前沿性研究、矿产资源调查与评价、土地资源调查与评价、矿产资源综 合利用、地质环境保护与地质灾害防治、国土资源信息技术、矿产资源勘查技术和国土资源 管理。 (二)成果资料数字化实施方案 项目工作主要是编制总体设计(包括编制成果数字化资料目录表、制定方案文档)、构 建成果资料数据库、开展成果资料数字化示范工作。 1.成果资料目录表。对 1980 年以来的成果登记资料全部进行采集,主要内容有:成果 登记号、成果名称、完成单位、密级、科研报告及专著、归档证明、任务书、评价证明、图 件或表册等数据项,并标注各种文件缺失情况及成果报告页数。 2.制定科技成果资料数字化技术要求。根据目前的信息化技术,编制“成果资料数字化 技术要求”,包括制定纸质资料数字化标准(包括资料分类、数字化基本流程、资料整理、 资料扫描、数据处理及电子文档管理)、已汇交的电子文档处理和在线登记电子文档等数字 化标准要求,建立起一套完善的成果资料数字化作业流程。 3.制定科技成果资料数字化工作方案。结合库存成果资料的实际情况,从成果资料的 管理和社会化服务两方面出发,制订成果资料数字化具体工作任务(包括数字化资料建库标 准、数字化技术指标和工作进度安排等)。 4.制定科技成果资料服务方案初稿。该方案主要是以信息系统和数据库为手段,进行数 据发布、共享,主要是制定用户权限和信息发布内容等。 5.构建科技成果资料数据库。实现了成果资料的分类管理和查询。规范了成果查询指标 体系、完善了目录查询功能、构建了不同角色用户的访问权限、构建成果资料全文图文浏览 界面、搭建成果资料数字化文档和已有目录数据库的衔接。 6.开展成果资料的数字化示范工作。针对 80 项科研报告进行数字化,主要是对成果报 告进行扫描和 OCR 软件识别的示范工作。 (三)成果资料数字化总体技术方法 1.成果资料数字化技术方法 根据国家档案局《纸质档案数字化技术规范》、《电子文件归档与管理规范》等数字化行 业标准,并针对不同历史时期形成的资料采取不同的技术方法。 首先对纸介质的成果图文资料采用扫描的办法输入计算机系统,经过消蓝、修编、数据 压缩后进行数字化存储;对国土资源部成立以来的纸介质成果报告及专著扫描后进行矢量化 (利用清华 OCR 技术),存储成 PDF 格式(双层 PDF,前台中保持原来的图像,将可搜索文 本置于图像背后,OCR 识别后使纯图像扫描页面为可搜索文

文档评论(0)

xyl118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档